月度归档： 2024 年 6 月

为什么大型语言模型需要适应不同用户群体的偏好？
大型语言模型（LLMs）是一类强大的人工智能模型，可以处理和生成自然语言文本，如文章、对话和翻译。这些模型在许多任务上表现出色，但它们通常需要经过微调来适应特定的任务或用户需求。

微调LLMs的常用方法是通过强化学习与人类反馈（RLHF）来调整模型的偏好。这意味着让人类标注者提供关于不同文本选项的偏好，然后通过优化模型的策略来使其更符合这些偏好。然而，这些偏好数据通常来自不同的标注者群体，他们可能具有不同的文化背景、语言特点、年龄、性别等特征。

传统的RLHF方法存在一个问题，它们采用了所谓的“一刀切”策略，即假设所有群体的偏好是一致的，并且只优化一个单一的偏好模型。然而，不同群体的偏好可能存在差异，这可能导致模型在特定群体中的性能不佳。例如，一个模型在年轻人中可能表现出色，但在年长的用户中则可能表现不佳。

为了解决这个问题，研究人员提出了一种名为Group Robust Preference Optimization（GRPO）的方法，旨在使LLMs能够更好地适应不同用户群体的偏好。GRPO方法考虑了不同群体的独特特征和需求，并通过优化策略以最大化最差情况下的群体性能来提高模型的鲁棒性。

GRPO方法是如何工作的？

GRPO方法通过以下关键步骤来优化LLMs以适应不同用户群体的偏好：

1. 群体信息整合

与传统方法不同，GRPO方法将来自不同群体的偏好数据整合到模型训练中。这意味着模型会考虑多个偏好分布，而不是仅仅假设一个单一的分布。

2. 最坏情况性能优化

GRPO方法的目标是优化策略，使得模型在最坏情况下的群体性能也能得到最大化。具体而言，它通过最大化不同群体损失的最小值来实现。这意味着模型将努力在最差表现的群体中保持较好的性能。

3. 自适应权重调整

GRPO方法根据不同群体的累积损失动态调整权重，以优先考虑那些累积损失较大的群体。这样做可以确保模型更关注性能较差的群体，并在后续的训练中给予它们更多的重视。

4. 理论分析与算法设计

为了保证GRPO方法的可行性，研究人员进行了理论分析，并设计了相应的算法来解决群体鲁棒偏好优化问题。他们提供了一些收敛性保证，以确保算法能有效地优化模型策略。

5. 实验验证

研究人员在合成数据集和真实世界数据上进行了实验验证GRPO方法的有效性。他们发现，通过使用GRPO方法微调LLMs，可以显著提高最差表现群体的性能，并减少不同群体之间的性能差距。实验结果显示，GRPO方法相比非鲁棒基线在损失和准确性方面取得了显著的改进。

GRPO方法的应用前景和未来工作

GRPO方法的提出为解决LLMs在不同用户群体间偏好对齐的问题提供了一种新的解决方案。通过考虑不同群体的特征和需求，GRPO方法能够使模型更加鲁棒和公平，提高用户体验。

未来的研究可以进一步探索以下方向：
- 提高算法效率，尤其是在处理大规模数据集和复杂模型时。
- 更精细的超参数调整策略，以适应不同的应用场景和数据分布。
- 探索其他类型的损失函数，以进一步提高模型的鲁棒性和性能。
- 考虑更广泛的群体特征，如文化、语言和社会经济背景，以实现更全面的群体鲁棒性。
- 在更广泛的实际应用中测试GRPO方法，如医疗、教育和商业领域，以验证其在现实世界中的有效性。
- 进一步研究群体间和群体内的差异，以及如何平衡这些差异以实现最佳的模型性能。
- 提高模型的解释性，以更好地理解不同群体偏好如何影响模型的决策。
通过在这些方向上进行进一步的研究，可以提高GRPO方法的实用性、有效性和泛化能力，从而更好地服务于多样化的用户群体。

参考文献：
- Shyam Sundhar Ramesh, Yifan Hu, Iason Chaimalas, Viraj Mehta, Pier Giuseppe Sessa, Haitham Bou Ammar, Ilija Bogunovic. (2024). Group Robust Preference Optimization in Reward-free RLHF. [PDF13] [Copy] [Kimi33]
2024 年 6 月 2 日
S3D：低内存GPU上的自推测解码方案
引言

大型语言模型（Large Language Models，LLMs）在自然语言处理领域起着重要作用，能够生成人类语言的连续文本，为我们提供强大的语言处理能力。然而，LLMs在推理过程中面临一个重要问题，即幻觉（Hallucination）问题。幻觉指的是模型生成看似合理但实际上不准确的信息，这可能导致误导性的结果和信息的传播。

为了更好地理解和解决LLMs中的幻觉问题，研究者们进行了大量的研究工作。其中一篇关于幻觉问题的研究论文是《S3D: A Simple and Cost-Effective Self-Speculative Decoding Scheme for Low-Memory GPUs》。这篇论文提出了一种名为Skippy Simultaneous Speculative Decoding（简称S3D）的自推测解码方案，旨在解决在低内存GPU上进行LLM推理时的性能和内存限制问题。

S3D方案解决的问题

S3D方案的目标是解决在低内存GPU上进行LLM推理时的性能和内存限制问题。传统的推测解码方法在高端设备上实现了显著的加速，但在低内存设备上却存在性能下降的问题。此外，量化带来的内存开销也限制了LLMs在低内存GPU上的应用。因此，S3D方案旨在提供一种成本效益高、适用于低内存GPU的自推测解码方法。

相关研究

在幻觉问题的研究领域，已经有许多相关研究取得了重要进展。其中，早期的推测解码方法、多标记预测、雅可比迭代方法、层跳过技术以及其他SD系统等都与S3D方案有一定的关联。

S3D方案的关键内容

S3D方案提出了Skippy Simultaneous Speculative Decoding（S3D）方法，通过同时多标记预测和中层跳过的方式实现自推测解码。S3D方法不需要额外的显存成本，同时具备高训练效率。与其他SD系统相比，S3D方法在性能-内存比率方面表现出色，且无需进行大规模的架构调整和训练数据的修改。

实验验证

论文中进行了一系列实验来验证S3D方案的性能。实验结果表明，S3D在性能-内存比率方面表现出色，相较于其他开源SD系统，具有更好的性能。此外，论文还进行了成本效益和速度的比较实验，验证了S3D方案的有效性和实用性。

进一步的研究方向

尽管S3D方案已经取得了一定的研究成果，但仍有一些潜在的研究方向值得进一步探索。这些方向包括适配器技术、更广泛的硬件评估、更深入的超参数优化、模型泛化能力、量化和稀疏性、并行化和分布式训练、实时应用、鲁棒性和错误分析、与其他优化技术的集成、用户研究和应用案例等。

通过进一步的研究探索，可以更好地理解S3D方案的潜绪和局限性，并推动其在更广泛的领域中的应用。

结论

《S3D: A Simple and Cost-Effective Self-Speculative Decoding Scheme for Low-Memory GPUs》论文提出了一种名为S3D的自推测解码方案，旨在解决低内存GPU上进行LLM推理时的性能和内存限制问题。S3D方案通过同时多标记预测和中层跳过的方式实现自推测解码，具备成本效益高、训练效率高的优点。实验结果表明S3D在性能和内存比率方面表现出色，并具有实际应用的潜力。进一步的研究可以在适配器技术、更广泛的硬件评估、模型泛化能力等方面开展，以推动S3D方案的发展和应用。

参考文献：
- Wei Zhong, Manasa Bharadwaj. “S3D: A Simple and Cost-Effective Self-Speculative Decoding Scheme for Low-Memory GPUs.” 2024.
S3D (Skippy Simultaneous Speculative Decoding) is a simple and cost-effective self-speculative decoding scheme designed for low-memory GPUs. It aims to achieve fast inference, low VRAM costs, and high training efficiency [1].

Speculative decoding (SD) is a technique that accelerates low-latency model (LLM) inference without sacrificing quality. It works by drafting tokens at a faster speed and then verifying the guessed tokens at the end of an iteration using a full forward pass. However, existing SD methods often achieve optimal performance on high-end devices or with a substantial GPU memory overhead. When applied to smaller models or low-memory devices where quantization is necessary, these methods can experience significant slowdowns [1].

To address these challenges, S3D introduces mid-layer skipping and simultaneous multi-token predictions. It offers no added VRAM costs and high training efficiency. By leveraging memory efficiency, S3D demonstrates optimal performance-memory ratios among recent open-source SD models. It can avoid significant quantization overheads under certain VRAM constraints and outperform previous SD methods under 8-bit quantization by up to 3.9x in speedups on A10G GPU [1].

S3D also provides optimal hyper-parameters by formalizing the relationship between the number of skipped layers and speedup in self-speculative decoding. It can verify the optimal number of token predictors, leading to improved performance [1].

In summary, S3D is a cost-effective self-speculative decoding scheme that achieves fast inference, low VRAM costs, and high training efficiency for low-memory GPUs. It overcomes the limitations of existing SD methods and demonstrates optimal performance-memory ratios [1].

Learn more:
S3D是一种简单且经济高效的自我推测解码方案，专为低内存GPU设计。该方法通过同时进行多令牌解码和中间层跳过来实现推测解码，既不增加显存开销，又具有高训练效率[1]。

S3D的主要特点和贡献包括：
1. 有效的自我推测解码：S3D采用了中间层跳过和同时进行多令牌预测的简单且节省内存的自我推测解码方案。相比之前的方法，S3D在较小的模型上克服了速度上的限制[1]。
2. 最优超参数：S3D通过对自我推测解码中跳过层数和速度提升之间关系的形式化研究，确定了最优的令牌预测器数量[1]。
3. 最优速度-内存比：S3D在最近的开源自我推测解码模型中展现出最优的性能-内存比。通过利用内存效率，S3D可以避免在特定显存限制下进行量化时产生的显著开销，并在A10G GPU上在8位量化下比之前最快的SD方法（EAGLE）提升了3.9倍的速度[1]。
相关工作方面，早期的自我推测解码方法主要集中在特定领域任务上，如翻译和语法错误修正，这些任务很容易实现显著的加速。而S3D则针对通用领域任务，通过同时预测多个令牌和非批处理解码来节省内存并提高训练效率[2]。

Learn more:
2024 年 6 月 2 日
分析大型语言模型中的幻觉问题
引言

大型语言模型（Large Language Models，LLMs）在自然语言处理领域扮演着重要的角色，它们可以生成人类语言的连续文本，为我们提供了强大的语言处理能力。然而，随着模型规模的增大和训练数据的增加，LLMs也面临着一个严重的问题，即幻觉（Hallucination）问题。幻觉指的是模型生成看似合理但实际上不准确的信息，这可能导致误导性的结果和信息的传播。

为了更好地理解和解决LLMs中的幻觉问题，研究者们进行了大量的研究工作。其中一篇关于幻觉问题的研究论文是《Analytical Annotation of Hallucinations in Large Language Models (ANAH)》。这篇论文提出了一种分析性注释的方法，以便更详细地研究和量化LLMs中的幻觉问题。

ANAH数据集：详细注释LLMs中的幻觉

为了深入研究LLMs中的幻觉问题，研究者们创建了一个名为ANAH的双语数据集。ANAH数据集提供了对LLMs在生成式问答（Generative Question Answering）任务中幻觉问题的分析性注释。数据集中的每个答案句子都经过了严格的注释，包括参考片段的检索、幻觉类型的判断以及对幻觉内容的更正。

ANAH数据集由人工和自动化注释流程构建而成。通过这个数据集，研究者们能够量化和分析LLMs中幻觉的累积效应，并训练和评估幻觉注释器的性能。实验结果表明，经过训练的生成性幻觉注释器在性能上能够与最先进的模型相媲美，并展现出更好的泛化能力。

幻觉问题的研究进展

幻觉问题在自然语言处理领域一直备受关注。研究者们提出了多种方法来解决幻觉问题，包括幻觉检测和评估、幻觉缓解、基准测试、知识增强等。这些方法的目标都是提高模型的可靠性和准确性，减少幻觉的产生。

例如，为了评估幻觉问题，研究者们构建了各种基准测试集，设计了挑战性的问题，并通过评估答案中幻觉的水平来衡量模型的性能。此外，还有一些研究探索了如何在模型的训练和推理阶段减轻幻觉问题，例如通过多任务学习、模型编辑和强化学习等方法。

未来的研究方向

尽管已经取得了一些进展，但解决LLMs中的幻觉问题仍然是一个具有挑战性的任务。未来的研究可以在以下几个方向上进行探索：
1. 数据集扩展：将ANAH数据集的规模扩大，覆盖更广泛的主题和任务，以更全面地理解和解决幻觉问题。
2. 模型泛化能力：研究如何提高模型在未见主题和未见问题上的泛化能力，使其能够更好地应对各种情况。
3. 训练策略优化：探索不同的训练策略，如半监督学习、元学习等，以提高模型在有限数据上的性能和泛化能力。
4. 提高模型解释性：研究如何提高幻觉注释器的解释性，使其能够提供更详细的解释和证据，以支持其注释和纠正决策。
5. 多模态和跨语言能力：考虑多模态数据（如图像、视频）和跨语言能力，以提高模型对不同类型输入的理解和生成能力。
6. 模型鲁棒性：进一步提高模型对对抗性攻击和输入扰动的鲁棒性。
7. 长期影响评估：评估幻觉注释器在长期应用中的效果，包括用户对模型输出的信任度和依赖性的变化。
8. 知识更新和维护：研究如何定期更新和维护模型的知识库，以确保其提供的信息是最新和准确的。
9. 用户定制化和个性化：探索如何根据用户的特定需求和偏好定制化和个性化模型的输出。
这些研究方向将有助于进一步提高LLMs的可靠性、准确性和用户满意度。

结论

本文总结了《Analytical Annotation of Hallucinations in Large Language Models (ANAH)》论文的主要内容。该论文通过创建详细的注释数据集和训练幻觉注释器，提供了一种系统的框架来研究和解决LLMs中的幻觉问题。幻觉注释器能够提高模型的可靠性并减少幻觉的产生。然而，幻觉问题仍然具有挑战性，需要进一步的研究来改进模型的性能和泛化能力。

参考文献：
- Ziwei Ji, Yuzhe Gu, Wenwei Zhang, Chengqi Lyu, Dahua Lin, Kai Chen. “Analytical Annotation of Hallucinations in Large Language Models (ANAH).” 2024.
2024 年 6 月 2 日
通俗易懂：理解ICE协议及其Java实现ice4j
引言

在网络通信中，当涉及到穿越网络地址转换（NAT）设备时，传统的通信协议可能会面临一些挑战。为了解决这个问题，我们需要使用一种特殊的协议来实现穿越NAT设备的功能。其中一种常用的协议是ICE（Interactive Connectivity Establishment）协议，它将STUN（Simple Traversal of UDP through NAT）和TURN（Traversal Using Relays around NAT）等工具结合起来，为基于Offer/Answer的协议（如SIP和XMPP）提供了一种强大的穿越NAT的机制。

在本文中，我们将介绍ICE协议及其在Java中的实现ice4j。我们将详细讨论ICE协议的原理、作用，以及ice4j项目的特点和用途。让我们一步步深入了解ICE协议及其Java实现ice4j吧！

ICE协议的原理和作用

ICE协议是一种用于解决NAT穿越问题的协议。它通过结合STUN和TURN等工具，提供了一种机制来使基于Offer/Answer的协议能够穿越NAT设备。

ICE协议的核心思想是在通信的两端（称为对等体）之间建立一个可靠的连接。ICE协议通过以下步骤实现穿越NAT的功能：
1. 收集候选地址：对等体收集自己的IP地址和端口号，并将其作为候选地址。这些候选地址可以是本地的IP地址，也可以是通过STUN服务器获取的公网地址。
2. 建立连接：对等体之间交换候选地址，然后根据一系列规则和优先级选择最佳的候选地址来建立连接。
3. NAT穿越：如果对等体之间的直接连接无法建立，ICE协议将尝试使用TURN服务器作为中继来实现穿越NAT。
通过以上步骤，ICE协议能够有效地解决NAT穿越的问题，确保通信双方能够建立可靠的连接。

ice4j项目的特点和用途

ice4j是一个用Java实现的ICE协议库，它提供了一些特色功能和用途，使其成为开发者们首选的ICE协议实现之一。
1. 简化开发：ice4j提供了一套简单易用的API，使开发者能够快速、方便地集成ICE协议功能到他们的应用程序中。
2. 支持Pseudo TCP：除了基本的ICE功能，ice4j还支持Pseudo TCP协议，这是一种通过UDP模拟TCP连接的技术。它提供了可靠的数据传输，并通过模拟TCP的流量控制和拥塞控制来优化传输性能。
3. Socket共享：ice4j支持在多个应用程序之间共享同一个UDP套接字，这样可以有效地减少网络资源的占用。
通过使用ice4j，开发者们可以轻松地实现ICE协议的功能，从而使他们的应用程序能够在复杂的网络环境中实现可靠的通信。

ice4j的应用举例

以下是一些使用ice4j的典型应用场景：
1. 即时通信应用：ice4j可以用于构建支持实时音视频通信的应用程序，如视频会议、在线聊天等。它能够帮助应用程序穿越NAT设备，实现可靠的点对点通信。
2. WebRTC应用：WebRTC是一种用于在Web浏览器中实现实时通信的技术，而ICE协议是WebRTC的核心组成部分之一。通过使用ice4j，开发者可以轻松地在WebRTC应用中实现NAT穿越和建立可靠的连接。
3. 网络游戏：在网络游戏中，玩家之间需要建立可靠的连接以进行实时游戏交互。通过使用ice4j，开发者可以实现游戏服务器和客户端之间的可靠通信，提供流畅的游戏体验。
总结

ICE协议及其Java实现ice4j为解决NAT穿越问题提供了一种强大的机制。通过收集候选地址、建立连接和使用中继服务器，ICE协议能够实现可靠的点对点通信。ice4j作为ICE协议的Java实现，提供了简化开发、支持Pseudo TCP和Socket共享等特色功能，使开发者能够轻松地集成ICE协议功能到他们的应用程序中。

参考文献：
- GitHub – jitsi/ice4j
2024 年 6 月 2 日
ActivityPub：去中心化社交网络协议
ActivityPub 是一个去中心化的社交网络协议，基于 ActivityStreams 2.0 数据格式。它提供了从客户端到服务器的 API，用于创建、更新和删除内容，以及一个从服务器到服务器的 API，用于传递通知和内容。本文将深入探讨 ActivityPub 的核心概念和实现方式。

什么是 ActivityPub？

ActivityPub 是一种标准化的协议，旨在实现去中心化的社交网络。它包括两个主要部分：
1. 客户端到服务器的协议：允许用户（包括真实用户、机器人和其他自动化进程）通过他们在服务器上的账户与 ActivityPub 通信。这可以通过手机、桌面应用或网页应用实现。
2. 服务器到服务器的协议：使去中心化网站能够共享信息和内容。
基本概念

在 ActivityPub 中，用户通过其在服务器上的账户表示为“actors”。每个 actor 都有一个收件箱（inbox）和发件箱（outbox），用于接收和发送消息。
```
{
  "@context": "https://www.w3.org/ns/activitystreams",
  "type": "Person",
  "id": "https://social.example/alyssa/",
  "name": "Alyssa P. Hacker",
  "preferredUsername": "alyssa",
  "summary": "Lisp enthusiast hailing from MIT",
  "inbox": "https://social.example/alyssa/inbox/",
  "outbox": "https://social.example/alyssa/outbox/",
  "followers": "https://social.example/alyssa/followers/",
  "following": "https://social.example/alyssa/following/",
  "liked": "https://social.example/alyssa/liked/"
}
```
客户端到服务器的交互

客户端通过向 actor 的发件箱（outbox）发送 POST 请求来发布活动。请求必须包含一个 Activity 对象，服务器随后会将其处理并传递到目标收件箱。

发布活动示例

假设 Alyssa 想给她的朋友 Ben 发送一条消息，询问他是否还书。她的消息可以表示为一个 ActivityStreams 对象，并通过 POST 请求发送到她的 outbox。
```
{
  "@context": "https://www.w3.org/ns/activitystreams",
  "type": "Note",
  "to": ["https://chatty.example/ben/"],
  "attributedTo": "https://social.example/alyssa/",
  "content": "Say, did you finish reading that book I lent you?"
}
```
服务器会将此消息包装在一个 Create 活动中，并将其 POST 到 Ben 的收件箱。

接收消息

Alyssa 的手机会通过 GET 请求轮询她的收件箱，以获取新消息。当 Ben 回复了她的消息，她会看到如下内容：
```
{
  "@context": "https://www.w3.org/ns/activitystreams",
  "type": "Create",
  "id": "https://chatty.example/ben/p/51086",
  "to": ["https://social.example/alyssa/"],
  "actor": "https://chatty.example/ben/",
  "object": {
    "type": "Note",
    "id": "https://chatty.example/ben/p/51085",
    "attributedTo": "https://chatty.example/ben/",
    "to": ["https://social.example/alyssa/"],
    "inReplyTo": "https://social.example/alyssa/posts/49e2d03d-b53a-4c4c-a95c-94a6abf45a19",
    "content": "<p>Argh, yeah, sorry, I'll get it back to you tomorrow.</p><p>I was reviewing the section on register machines, since it's been a while since I wrote one.</p>"
  }
}
```
服务器到服务器的交互

服务器之间通过向 actor 的收件箱发送 POST 请求来传递消息。这种交互方式允许去中心化的社交网络跨不同服务器传递信息。

示例：服务器间的消息传递

当 Alyssa 发布一条消息到她的 outbox，服务器会查找消息的目标收件箱，并将消息 POST 到这些收件箱。这样，Ben 的服务器就能接收到 Alyssa 的消息，并将其存储在 Ben 的收件箱中。

安全性与认证

ActivityPub 使用认证机制来验证客户端与服务器之间、以及服务器与服务器之间的互动。为了确保内容的真实性，服务器应验证接收到的内容，确保其来自声称的 actor，并且该 actor 有权限更新资源。

验证示例

服务器在接收到一个活动后，应验证该活动的 id 和 actor 属性，确保其真实性。例如：
```
{
  "@context": "https://www.w3.org/ns/activitystreams",
  "type": "Like",
  "actor": "https://example.net/~mallory",
  "to": ["https://hatchat.example/sarah/", "https://example.com/peeps/john/"],
  "object": {
    "@context": {"@language": "en"},
    "id": "https://example.org/~alice/note/23",
    "type": "Note",
    "attributedTo": "https://example.org/~alice",
    "content": "I'm a goat"
  }
}
```
服务器应确保 id 和 actor 属性合法，并查验对象是否由 actor 创建。

结论

ActivityPub 通过提供去中心化的社交网络协议，实现了更高的自由度和隐私保护。无论是客户端到服务器的交互，还是服务器到服务器的消息传递，ActivityPub 都为构建去中心化的社交网络提供了强大的工具。

参考文献
- ActivityPub 规范
- ActivityStreams 2.0
通过了解和实现 ActivityPub，我们可以构建一个更加自由和开放的互联网社交网络环境。
2024 年 6 月 2 日
ActivityPub：构建分布式社交网络的开放协议
什么是ActivityPub

ActivityPub是一种开放的、基于分布式社交网络的协议，用于创建、更新和删除内容，并实现服务器之间的通信和内容传递。它为客户端到服务器和服务器到服务器提供了API接口，使得用户可以方便地在不同的社交网络平台之间进行交流和互动。

ActivityPub的目标是构建一个去中心化的社交网络，让任何人都可以在网络上运行自己的节点，并与其他服务器上的用户进行关注、点赞、评论等互动。这种去中心化的架构使得用户可以更好地掌控自己的数据和隐私，并且不受单一平台的限制。

ActivityStreams：社交网络的共同词汇

ActivityPub使用ActivityStreams作为其词汇，它包含了表示社交网络中各种活动和内容的常用术语。ActivityStreams的词汇已经包含了大部分我们在社交网络中需要使用的词汇，但即使它没有覆盖到我们所需的所有情况，我们仍然可以通过扩展JSON-LD来自定义新的词汇。

JSON-LD是一种用于表示语义数据的JSON扩展格式，它可以将数据组织成图形结构，并提供了一种机制来连接不同的数据源。对于了解JSON-LD的人来说，可以采取更加高级的链接数据方法；而对于不熟悉JSON-LD的人来说，JSON-LD文档和ActivityStreams可以被理解为普通的JSON格式。通过使用JSON-LD，我们可以更好地描述和表示社交网络中的各种活动和内容。

ActivityPub的工作原理

在ActivityPub中，用户通过其在服务器上的帐户来表示为”actors”，每个帐户对应一个独立的”actor”。每个”actor”都有自己的收件箱（inbox）和发件箱（outbox），用于接收和发送消息。用户可以在发件箱中发布消息，其他用户可以通过收件箱接收到这些消息。服务器之间也可以相互传递消息和内容，以实现跨服务器的互联互通。

举个例子，假设我们有两个用户Alyssa和Ben，他们分别在不同的服务器上拥有自己的帐户。当Alyssa想给Ben发送一条消息时，她会将消息发布到自己的发件箱中。然后，Alyssa的服务器会查找Ben的收件箱地址，并将消息发送到Ben的收件箱中。Ben可以通过检查自己的收件箱来读取Alyssa发送的消息。

此外，ActivityPub还支持用户之间的关注、点赞、评论等互动。用户可以关注其他用户的帐户，以便在自己的收件箱中接收他们的消息。用户还可以对其他用户的帖子进行点赞或评论，这些互动也会通过服务器之间的通信进行传递。

ActivityPub的工作进展

ActivityPub协议是世界广泛支持的社交网络标准，在Fediverse中得到了广泛应用。该标准由Evan Prodromou（StatusNet的创始人）等人共同编写，并于2018年1月被W3C发布为推荐标准。

ActivityPub的独特之处在于它允许用户在不同的服务器上创建帐户，并与其他服务器上的用户进行互动。这种联邦架构使得用户可以选择自己喜欢的服务器，并与其他用户跨服务器进行关注、点赞、评论等互动。

目前，许多社交网络平台已经实现了ActivityPub协议，包括Mastodon、PeerTube、Pixelfed等。这些平台都允许用户在自己的服务器上创建帐户，并与其他平台上的用户进行互动。用户可以通过关注其他用户的帐户，接收他们的消息和更新。他们还可以在自己的发件箱中发布消息，使其可供其他用户阅读和互动。

此外，ActivityPub还支持用户之间的私信功能。用户可以通过私信功能与其他用户进行一对一的私密对话，这些对话只有双方能够看到。

ActivityPub的应用案例

Mastodon是基于ActivityPub协议构建的一个开源微博平台，类似于Twitter。用户可以在Mastodon上创建自己的帐户，并与其他用户进行关注、点赞、评论等互动。Mastodon的一个独特之处在于它由许多独立的服务器组成，这些服务器之间通过ActivityPub协议进行通信，用户可以选择加入任何一个服务器。

PeerTube是基于ActivityPub协议构建的一个开源视频分享平台，类似于YouTube。用户可以在PeerTube上上传和分享视频，并与其他用户进行互动。PeerTube的联邦架构允许用户自主选择他们信任的服务器，并在不同的服务器之间共享视频内容。

Pixelfed是基于ActivityPub协议构建的一个开源图片分享平台，类似于Instagram。用户可以在Pixelfed上上传和分享图片，并与其他用户进行互动。Pixelfed的联邦架构使得用户可以选择他们喜欢的服务器，并与其他服务器上的用户进行互动。

ActivityPub的未来发展

随着ActivityPub协议的不断发展和完善，越来越多的社交网络平台将采用这一标准。这将促进不同平台之间的互操作性和联邦互联，使用户能够更加自由地选择他们喜欢的平台，并与不同平台上的用户进行交流和互动。

未来，我们可以期待更多创新和发展，例如更加智能化的内容推荐算法、更加灵活的隐私设置以及更加丰富的互动功能。ActivityPub将继续推动社交网络的去中心化和用户自主性的发展，为用户提供更加丰富、安全和自由的社交网络体验。

参考文献：
1. ActivityPub – Wikipedia
2024 年 6 月 2 日
JBang：安装应用程序
引言

JBang是一款功能强大的工具，它不仅可以管理依赖项，还可以安装和管理应用程序。通过安装应用程序，我们可以轻松地将脚本和应用程序添加到系统的PATH中，从而在任何操作系统上都可以随时随地调用它们。本文将介绍如何使用JBang安装和管理应用程序。

安装应用程序

从版本0.56开始，JBang具备了使用jbang app命令将脚本和应用程序安装到系统的PATH中的功能。这对于在任何操作系统上轻松访问脚本和应用程序非常有用。

要开始使用，请运行jbang app setup命令。在Windows上，这将修改系统范围的PATH，以包含由JBang管理的文件夹。在基于bash/zsh的shell上，它将在你的bashrc或zshrc文件中设置PATH。

一旦设置完成，你就可以使用jbang app install <scriptRef>命令将脚本或应用程序安装到JBang管理的路径中。例如，jbang app install myscript.java将把myscript作为一个可以运行的命令。

你还可以使用别名，例如jbang app install gavsearch@jbangdev。

如果你有两个同名的脚本或应用程序，或者想要使用特定的名称，可以使用--name参数来控制生成的命令，例如jbang app install --name mvnsearch gavsearch@jbangdev。

如果想查看已安装的应用程序列表，可以使用jbang app list命令。如果想卸载脚本或应用程序，可以使用jbang app uninstall <name>命令。

导出应用程序

JBang还提供了导出应用程序的功能。通过导出应用程序，你可以将脚本和应用程序打包成可执行的JAR文件，以便在其他环境中运行。导出应用程序非常有用，特别是当你想与其他人共享你的脚本或应用程序时。

模板

JBang还支持使用模板来快速创建脚本和应用程序。模板是预先定义好的代码结构和文件布局，你可以根据需要选择和使用它们。使用模板可以加快开发速度，并确保项目具有一致的结构。

结论

通过JBang的应用程序安装功能，我们可以轻松地将脚本和应用程序添加到系统的PATH中，使其在任何操作系统上都可以随时调用。通过导出应用程序，我们可以打包脚本和应用程序，以便在其他环境中运行。使用模板可以快速创建具有一致结构的项目。

JBang为我们提供了强大且便捷的工具，使我们能够更好地管理和使用脚本和应用程序。

参考文献
- JBang官方网站
- JBang文档
2024 年 6 月 1 日
JBang：灵活的文件组织方式
引言

在软件开发过程中，良好的文件组织方式对于代码的可读性和可维护性至关重要。文件组织的合理性可以使我们更好地组织代码和资源文件，提高开发效率。本文将介绍一款名为JBang的工具，它提供了灵活的文件组织方式，使我们能够更好地组织和管理项目文件。

JBang的文件组织方式

JBang允许我们使用多个源代码文件，并提供了一种简单的方式来组织这些文件。我们可以将多个源文件放置在同一个源代码目录中，甚至可以在一定程度上使用包进行组织。

以下是一个示例，展示了如何在JBang中使用多个源文件：
```
Main.java

import model.Person;

public class Main {

    public static void main(String... args) {
        Person p = new Person(args[0]);
        System.out.println("Hello " + p.getName());
    }
}

model/Person.java

package model;

public class Person {
    String name;

    public String getName() {
        return name;
    }

    public Person(String n) {
        this.name = n;
    }
}
```
在这个示例中，我们有两个源代码文件：Main.java和model/Person.java。Main.java文件包含了应用程序的入口点，而model/Person.java文件定义了一个简单的Person类。我们可以通过在命令行中运行jbang Main.java来执行这个应用程序。

需要注意的是，当多个源文件相互引用时，有些情况下可能会出现问题。例如，如果model.Person引用了util.Generator，则会导致编译错误。此外，由于jbang edit在运行之前必须进行编译，因此它无法识别和处理多个源文件。

使用多个源文件的高级功能

从版本0.46开始，JBang提供了更高级的功能，使多个源文件的管理更加灵活。主要的脚本文件定义了所有的依赖项，而我们可以使用//SOURCES <filename>注释将更多的源文件添加到应用程序中。如果包含的源文件中存在//SOURCES注释，那么这些文件也将被递归地添加进来。对于.jsh脚本文件，包含的源文件将按照它们被发现的顺序进行添加，采用深度优先的方式。

在编译时，列出的文件名将被添加到源文件列表中。

需要注意的是，目前尚不支持使用*.java样式匹配或在这些.java文件中声明//DEPS或其他JBang配置。目前，这些配置只会被主要的脚本或应用程序所识别。根据反馈，未来将放宽这些限制。

添加更多资源文件

如果你想要添加META-INF/application.properties、META-INF/resource.index.html或其他文件到生成的JAR文件中，你可以使用//FILES注释来添加它们。

//FILES的格式为//FILES <mountpoint>[=<sourcefile>]。

以下是一个示例：
```
//FILES resource.properties
//FILES META-INF/resources/index.html=index.html
```
在这个示例中，resource.properties文件将被直接复制，而META-INF/resources/index.html文件的内容将来自于index.html文件。

所有的位置都需要相对于脚本所在的位置。

需要注意的是，目前jbang edit和基于HTTP(S)的脚本与//FILES不兼容。

用于命令行插件的无扩展名/非Java文件

你可以使用JBang编写命令行插件，例如kubectl、git等。这些插件希望插件能够以<cmd>-<plugin>的方式命名，例如kubectl-myplugin。

针对这种情况，JBang提供了两种方法来使其工作。第一种推荐的方式是使用jbang app install命令，在中间生成一个脚本来避免问题。例如，jbang app install --name kubectl-my-plugin myplugin.java。

第二种方式是利用JBang的自动处理能力，适用于只有一个文件且不需要中间脚本的情况。具体的做法如下：
- 将文件命名为kubectl-my-plugin，不包含.java或.jsh扩展名。
- JBang会将该文件复制到一个临时目录，并使用短横线命名法将文件名映射为合适的Java类名。
例如，如果你创建了一个名为kubectl-my-plugin的文件，JBang将会假设实际的类名为KubectlMyPlugin。

需要注意的是，当使用jbang edit时，JBang会创建一个符号链接，使得IDE将其视为普通的驼峰式Java类。

如果不遵循这种命名模式，将会导致编译错误，因为javac要求公共类和文件名相等。

此外，针对无扩展名的脚本，你可以在文件开头添加#!注释，以让应用程序识别它作为脚本处理。为了避免编译问题，JBang在编译之前会删除该注释行。

结论

JBang提供了灵活的文件组织方式，使我们能够更好地组织和管理项目文件。通过使用多个源文件和注释，我们可以轻松地组织代码结构，并将资源文件添加到生成的JAR中。此外，JBang还允许我们为命令行插件编写无扩展名的文件，并提供了便捷的命名约定。

合理的文件组织方式有助于提高代码的可读性和可维护性。通过使用JBang的文件组织功能，我们可以更加高效地开发和管理我们的项目。

参考文献
- JBang官方网站
- JBang文档
2024 年 6 月 1 日
JBang：简单依赖管理工具
引言

在软件开发过程中，我们经常需要使用各种各样的库和框架来构建功能强大的应用程序。然而，手动管理这些依赖项可能会变得非常复杂和耗时。在本文中，我们将介绍一款名为JBang的工具，它可以帮助我们轻松管理项目的依赖项。无论你是一名Java开发人员还是对软件开发感兴趣的新手，JBang都将是你的好帮手。

JBang简介

JBang是一款基于Java的命令行工具，它提供了一种简单且灵活的方式来管理项目的依赖项。使用JBang，我们可以轻松地指定所需的库和框架，并自动下载和安装它们，而无需手动处理复杂的依赖关系。JBang还提供了许多有用的功能，例如脚本执行、构建项目和编辑代码等。

安装和使用JBang

JBang的安装非常简单。你只需前往官方网站（JBang官网）下载适用于你的操作系统的安装包，然后按照说明进行安装即可。

安装完成后，你可以在命令行中输入jbang命令验证安装是否成功。如果成功，你将看到JBang的版本信息和可用命令列表。

指定和管理依赖项

在JBang中，我们可以使用两种方式指定和管理依赖项：使用内联注释或使用外部依赖文件。

内联注释方式

使用内联注释的方式非常简单。在你的脚本或代码文件中，你只需在需要引入依赖项的地方添加类似以下的注释：
```
//DEPS groupId:artifactId:version
```
其中，groupId代表库或框架的组织ID，artifactId代表项目的唯一标识符，version代表所需的版本号。你可以根据需要指定一个或多个依赖项，它们之间用空格分隔。

以下是一个使用内联注释指定依赖项的示例：
```
//DEPS org.apache.logging.log4j:log4j-core:2.14.1
//DEPS com.google.guava:guava:30.1-jre
```
在你运行脚本时，JBang将自动解析并下载所需的库和框架，并将其添加到类路径中，使其可供你的脚本使用。

外部依赖文件方式

除了使用内联注释，JBang还支持使用外部依赖文件来管理项目的依赖项。你可以创建一个文本文件（通常命名为dependencies.jsh），并在其中列出所需的依赖项，每个依赖项占一行。以下是一个外部依赖文件的示例：
```
org.apache.logging.log4j:log4j-core:2.14.1
com.google.guava:guava:30.1-jre
```
在你的脚本或代码中，你可以使用以下语法来引用外部依赖文件：
```
//DEPS {file=path/to/dependencies.jsh}
```
JBang将读取外部依赖文件，并自动解析和下载所需的库和框架。

解析和安装依赖项

一旦你在脚本或代码中指定了依赖项，JBang将自动解析并下载所需的库和框架。它会检查本地缓存中是否已经存在这些依赖项，如果不存在，就会从远程存储库中下载并安装它们。

当你第一次运行包含依赖项的脚本时，JBang会显示一个进度条，提示正在解析和下载依赖项。完成后，你就可以开始使用这些库和框架了。

示例说明

让我们通过一个简单的示例来演示JBang的使用。假设我们想编写一个使用log4j库进行日志记录的Java程序。

首先，我们需要在我们的代码中添加对log4j库的依赖。我们可以使用内联注释或外部依赖文件来指定依赖项。以下是在代码中使用内联注释的示例：
```
//DEPS org.apache.logging.log4j:log4j-core:2.14.1
```
或者，使用外部依赖文件的示例：

dependencies.jsh:
```
org.apache.logging.log4j:log4j-core:2.14.1
```
在你的代码中，你可以使用log4j进行日志记录。以下是一个简单的示例：
```
import org.apache.logging.log4j.LogManager;
import org.apache.logging.log4j.Logger;

public class LoggingExample {
    private static final Logger logger = LogManager.getLogger(LoggingExample.class);

    public static void main(String[] args) {
        logger.info("This is an info message");
        logger.warn("This is a warning message");
        logger.error("This is an error message");
    }
}
```
在这个示例中，我们首先导入了log4j库的必要类和接口。然后，我们创建了一个名为logger的静态变量，并使用LogManager.getLogger()方法获取日志记录器。最后，我们使用logger记录了不同级别的日志消息。

当我们运行这个程序时，log4j将根据配置的日志级别将日志消息输出到控制台或其他目标。

结论

JBang是一款强大且易于使用的依赖管理工具，它可以帮助我们简化项目的依赖项管理过程。通过使用内联注释或外部依赖文件，我们可以轻松指定所需的库和框架，并自动解析、下载和安装它们。JBang还提供了许多其他功能，例如脚本执行和项目构建等。

不管你是一名经验丰富的Java开发人员还是一个新手，JBang都会成为你开发过程中的有力助手。使用JBang，你将能够更快地构建功能丰富的应用程序，并在开发过程中更加专注于核心功能的实现。

参考文献
- JBang官方网站
- JBang文档
2024 年 6 月 1 日
JBang使用指南
简介

JBang是一款强大而灵活的工具，为开发者提供了便捷的方式来编写和运行Java代码。它可以处理包含main方法的单个.java文件，也可以处理.jsh文件（用于jshell）。下面我们将详细介绍JBang的安装和使用方法。

安装

要使用JBang，首先需要安装它。安装过程非常简单，只需按照以下步骤操作：
1. 访问JBang官方网站（https://www.jbang.dev/）。
2. 根据你的操作系统选择对应的安装包进行下载。
3. 安装完成后，你就可以使用JBang了。
使用方法

JBang的使用方法非常灵活，你可以通过以下几种方式来执行Java代码：
1. 直接运行Java文件：如果你有一个包含main方法的Java文件，你可以使用以下命令来运行它：
```
   jbang filename.java
```
这将直接执行该Java文件，并输出结果。
1. 执行.jsh文件：如果你有一个.jsh文件（用于jshell），你可以使用以下命令来执行它：
```
   jbang filename.jsh
```
JBang将会将该文件传递给jshell进行处理，并输出结果。
1. 运行已编译的Jar文件：JBang还支持直接运行已编译的.jar文件。你可以使用以下命令来运行.jar文件：
```
   jbang filename.jar
```
JBang会自动加载并执行该.jar文件。

依赖关系

在Java项目中，处理依赖关系是常见的任务。JBang提供了便捷的方式来管理和引入依赖关系。你可以通过在代码文件中添加//DEPS的注释来指定所需的依赖项，JBang会自动下载并加载这些依赖项。例如：
```
   //DEPS com.example:library:1.0.0
```
这将下载并加载名为”com.example:library:1.0.0″的依赖项。

Java版本

JBang兼容多个Java版本，你可以根据自己的需要选择合适的Java版本进行编译和运行。如果系统中没有指定的Java版本，JBang会自动下载并使用默认的Java版本。你也可以使用以下命令来指定Java版本：
```
   jbang --java java_version filename.java
```
其中，java_version表示你要使用的Java版本。

文件组织

JBang支持帮助你更好地组织和管理项目文件。你可以将相关的代码文件放在一起，以提高代码的可读性和维护性。例如，你可以将所有与数据库操作相关的文件放在一个名为”database”的文件夹中。

运行和调试

JBang提供了丰富的运行和调试功能，让你可以更轻松地执行和调试Java代码。你可以使用以下命令来运行和调试代码：
- 运行代码：
```
  jbang run filename.java
```
- 调试代码：
```
  jbang debug filename.java
```
编辑

JBang支持代码编辑功能，你可以通过指定编辑器来编辑代码文件，以提高开发效率。你可以使用以下命令来编辑代码：
```
jbang edit filename.java
```
JBang会打开默认编辑器，并加载指定的代码文件供你编辑。

导出和发布

当你的项目完成后，JBang提供了导出和发布的功能。你可以将代码打包成可执行的文件或发布到其他平台上。例如，你可以使用以下命令将代码导出为可执行的Jar文件：
```
jbang export filename.java
```
JBang会将代码打包成一个可执行的Jar文件，方便你在其他环境中运行。

依赖项

在Java项目中，处理依赖关系是非常常见的任务。JBang提供了便捷的方式来管理和引入依赖项。你可以通过在代码文件中添加//DEPS的注释来指定所需的依赖项，JBang会自动下载并加载这些依赖项。例如：
```
//DEPS org.apache.commons:commons-lang3:3.12.0
//DEPS com.google.guava:guava:30.1-jre
```
这样，JBang会自动下载并加载”org.apache.commons:commons-lang3:3.12.0″和”com.google.guava:guava:30.1-jre”这两个依赖项。

Java版本

JBang兼容多个Java版本，你可以根据自己的需要选择合适的Java版本进行编译和运行。如果系统中没有指定的Java版本，JBang会自动下载并使用默认的Java版本。你也可以使用以下命令来指定Java版本：
```
jbang --java java_version filename.java
```
其中，java_version表示你要使用的Java版本。

文件组织

JBang支持帮助你更好地组织和管理项目文件。你可以将相关的代码文件放在一起，以提高代码的可读性和维护性。例如，你可以将所有与数据库操作相关的文件放在一个名为”database”的文件夹中。

运行和调试

JBang提供了丰富的运行和调试功能，让你可以更轻松地执行和调试Java代码。你可以使用以下命令来运行和调试代码：
- 运行代码：
```
  jbang run filename.java
```
- 调试代码：
```
  jbang debug filename.java
```
编辑

JBang支持代码编辑功能，你可以通过指定编辑器来编辑代码文件，以提高开发效率。你可以使用以下命令来编辑代码：
```
jbang edit filename.java
```
JBang会打开默认编辑器，并加载指定的代码文件供你编辑。

导出和发布

当你的项目完成后，JBang提供了导出和发布的功能。你可以将代码打包成可执行的文件或发布到其他平台上。例如，你可以使用以下命令将代码导出为可执行的Jar文件：
```
jbang export filename.java
```
JBang会将代码打包成一个可执行的Jar文件，方便你在其他环境中运行。

以上是JBang的一些常用功能和使用方法。通过JBang，你可以更便捷地编写和运行Java代码，提高开发效率和代码质量。

参考文献：
JBang使用指南
2024 年 6 月 1 日
探索 JBang——Java 开发的全新体验
前言

Java 开发者们，无论您是学生、教育者还是专业开发人员，您是否曾经希望有一种更简单、更高效的方式来创建、编辑和运行 Java 程序？今天，我们将带您了解一个令人兴奋的工具——JBang。它不仅简化了 Java 应用的开发过程，还提供了丰富的功能和广泛的支持平台。

什么是 JBang？

JBang 是一个旨在让学生、教育者和专业开发人员能够轻松地创建、编辑和运行自包含的源代码 Java 程序的工具。借助 JBang，您可以在几乎任何操作系统上无缝地运行 Java 程序，而且无需复杂的设置过程。

多平台支持

安装与运行

JBang 可以安装并运行在 Windows、Linux、macOS、Docker 以及 GitHub Actions 上。此外，它还可以通过 Maven 和 Gradle 插件使用。这意味着无论您使用什么开发环境，都可以轻松集成 JBang。

无需预装 Java

如果您的系统上没有安装 Java，JBang 也能自动下载所需的 Java 版本。这极大地简化了初学者的上手过程。

嵌入式依赖管理

自动获取依赖

通过 JBang，您可以直接在源代码中使用 //DEPS group:artifact:version 或 @Grab 注解来自动获取任何依赖项。这使得依赖管理变得前所未有的简单和直接。
```
//DEPS org.slf4j:slf4j-api:1.7.30
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

public class HelloWorld {
    private static final Logger logger = LoggerFactory.getLogger(HelloWorld.class);

    public static void main(String[] args) {
        logger.info("Hello, World!");
    }
}
```
JBang AppStore

JBang 提供了一个 AppStore，您可以在其中找到其他人发布的应用程序，或者将您自己的应用程序发布到一个由 git 支持的 jbang-catalog.json 中。这为开发者提供了一个共享和发现工具的平台。

发布与发现应用

通过 JBang AppStore，您可以轻松地发现和使用其他开发者发布的应用程序，也可以发布自己的应用程序供其他人使用。这种共享机制促进了开发者之间的交流和协作。

IDE 集成

无论您使用的是 Intellij、Eclipse、Visual Studio Code、Apache Netbeans，还是 vim 和 emacs，JBang 都能轻松集成。它提供了适当的内容辅助和调试支持，使得开发过程更加流畅和高效。

轻松编辑与调试

JBang 提供了丰富的编辑和调试支持，让您在熟悉的开发环境中也能享受到 JBang 带来的便利。无论是代码补全、语法高亮还是调试功能，JBang 都能很好地与您的 IDE 集成。

选择合适的 Java 版本

JBang 支持从 Java 8 及更高版本的任何 Java 版本。您可以根据项目需求自由选择最合适的 Java 版本，享受最新的语言特性和性能提升。

灵活的版本支持

无论是需要使用 Java 8 的老项目，还是想要尝试最新的 Java 版本，JBang 都能满足您的需求。这种灵活性使得 JBang 成为一个非常适合多种场景的工具。

用户体验

很多用户都对 JBang 的使用体验表示赞赏。正如 Oliver Weiler 所说：“第一次使用 JBang 的体验真的很棒！你可以感觉到 @jbangdev 是用爱在做这件事！”

社区反馈

通过社交媒体和开发者社区，许多用户分享了他们的使用体验和心得。JBang 的用户友好性和强大的功能得到了广泛的认可和赞誉。

总结

JBang 为 Java 开发者提供了一种全新的开发体验。无论是简化的依赖管理、多平台支持、无缝的 IDE 集成，还是便捷的 AppStore，JBang 都展示了其强大的功能和极高的可用性。如果您还没有尝试过 JBang，现在就是开始的好时机！

欲了解更多信息并下载 JBang，请访问 JBang 官方网站。

参考文献：

JBang 官方网站
2024 年 6 月 1 日

在纯Java文件中推理Llama 2

在现代人工智能领域，推理大型语言模型（LLM）已经成为一个重要的应用场景。GitHub上的项目 mukel/llama2.java 提供了一种使用纯Java代码进行Llama 2推理的简洁实现。本文将详细介绍该项目的背景、构建方法及性能表现。

背景介绍

Llama 2是由Andrej Karpathy开发的一个非常简单的LLM推理实现。该项目的Java版本旨在提供教育价值，并用于在JVM上测试和调整编译器优化，特别是针对Graal编译器的优化。这一Java移植版本最初参考了llama2.scala。

构建与运行

要构建和运行该项目，您需要Java 21+，特别是其中的MemorySegment mmap-ing功能。以下是具体的构建步骤：

下载必要的文件： wget https://github.com/karpathy/llama2.c/raw/master/tokenizer.bin wget https://huggingface.co/karpathy/tinyllamas/resolve/main/stories15M.bin
手动构建与运行： javac --enable-preview -source 21 --add-modules=jdk.incubator.vector Llama2.java java --enable-preview --add-modules=jdk.incubator.vector Llama2 stories15M.bin
使用JBang直接运行： jbang Llama2.java stories15M.bin
使用Makefile和run.sh脚本： make # 可选，run.sh已经包含了make JAVA_HOME=$GRAALVM_HOME \ JAVA_RUNTIME_OPTIONS=-Djava.util.concurrent.ForkJoinPool.common.parallelism=8 \ ./run.sh stories15M.bin

生成本地镜像

使用GraalVM可以创建一个独立的本地镜像：

JAVA_HOME=$GRAALVM_HOME NATIVE_IMAGE_OPTIONS="-march=native" make native-image
./llama2 stories15M.bin

或者使用Profile-Guided Optimizations (PGO)：

JAVA_HOME=$GRAALVM_HOME \
NATIVE_IMAGE_OPTIONS="--pgo-instrument -march=native --initialize-at-build-time=Llama2 -Dllama2.VectorAPI=false" \
make native-image

# 生成默认的iprof配置文件
./llama2 -Djava.util.concurrent.ForkJoinPool.common.parallelism=0 stories15M.bin

# 构建优化后的镜像
JAVA_HOME=$GRAALVM_HOME \
NATIVE_IMAGE_OPTIONS="--pgo -march=native --initialize-at-build-time=Llama2 -Dllama2.VectorAPI=false" \
make native-image

# 优化后的运行速度应该比普通镜像快约2倍
./llama2 stories15M.bin

性能表现

以下是该项目在不同配置下的性能测试结果（基于AMD Ryzen 3950X 64GB，Arch Linux）：

单线程测试

模型	每秒处理Token	相对于llama2.c的加速	实现
stories15M.bin	363	1.0	llama2.c
stories15M.bin	237	0.65	llama2.java
stories110M.bin	51.71	1.0	llama2.c
stories110M.bin	42.20	0.81	llama2.java
llama2_7B.bin	0.92	1.0	llama2.c
llama2_7B.bin	0.88	0.95	llama2.java

多线程测试

模型	每秒处理Token	相对于llama2.c的加速	实现
stories15M.bin	1233	1.0	llama2.c
stories15M.bin	438	0.35	llama2.java
stories110M.bin	90	1.0	llama2.c
stories110M.bin	80	0.88	llama2.java
llama2_7B.bin	1.68	1.0	llama2.c
llama2_7B.bin	1.65	0.98	llama2.java

需要注意的是，Java版本在多线程情况下的性能提升并不显著，这主要是由于内存带宽限制所致。

结论

mukel/llama2.java项目展示了如何使用纯Java代码实现Llama 2推理，并在一定程度上达到了与原始C实现相当的性能。尽管当前版本的性能尚未完全优化，但其作为教育工具和编译器优化测试平台已经展现出巨大潜力。

参考文献：GitHub – mukel/llama2.java

2024 年 6 月 1 日

探索 Llama 3 在 Java 中的实际应用
引言

在现代人工智能领域，模型推理的效率和方便性是技术人员关注的核心问题。如今，我们将目光投向一个名为 Llama 3 的项目，该项目旨在在 Java 环境中实现 Llama 3 的推理。这一项目不仅是其前身 Llama2.java 的延续，还在多个方面进行了优化和改进。让我们深入了解这个项目的细节及其实现方法。

项目背景

Llama 3 是基于 Andrej Karpathy 的 llama2.c 项目的一个扩展版本。Llama3.java 通过单个 Java 文件实现了 Llama 3 的推理，除了教育价值外，还为在 JVM 上测试和调整编译器优化和功能提供了便利，特别是针对 Graal 编译器的优化。

项目特点

1. 单文件实现，无依赖

Llama3.java 的一大特点是其实现是通过单个 Java 文件完成的。这种设计简化了项目的依赖管理，使得项目的部署和维护更加便捷。

2. 支持多种量化格式

项目支持 GGUF 格式解析，并且提供了对 Q8_0 和 Q4_0 量化的支持。Q4_0 量化模型由于其较小的体积和较高的运行效率，成为推荐使用的模型。

3. 高效的矩阵-向量乘法

针对量化张量，项目使用了 Java 的 Vector API 实现了快速的矩阵-向量乘法。这一实现提高了推理的运行速度，特别是在处理大规模数据时。

4. 简单的命令行界面

Llama3.java 提供了一个简单的命令行界面，支持 --chat 和 --instruct 模式，使用户能够方便地与模型进行交互。

项目设置与运行

下载量化模型

首先，需要从 Hugging Face 下载纯 Q4_0 和（可选的）Q8_0 量化的 .gguf 文件。推荐使用大约 4.3GB 的 Q4_0 量化模型：
```
curl -L -O https://huggingface.co/mukel/Meta-Llama-3-8B-Instruct-GGUF/resolve/main/Meta-Llama-3-8B-Instruct-Q4_0.gguf

# 可选地下载 Q8_0 量化模型（约 8GB）
# curl -L -O https://huggingface.co/mukel/Meta-Llama-3-8B-Instruct-GGUF/resolve/main/Meta-Llama-3-8B-Instruct-Q8_0.gguf
```
手动量化

如果需要生成纯 Q4_0 量化模型，可以使用 llama.cpp 提供的量化工具从高精度的 .gguf 源文件生成：
```
./quantize --pure ./Meta-Llama-3-8B-Instruct-F32.gguf ./Meta-Llama-3-8B-Instruct-Q4_0.gguf Q4_0
```
构建与运行

Llama3.java 需要 Java 21 及以上版本，特别是 MemorySegment mmap-ing 功能。可以使用 jbang 工具运行：
```
jbang Llama3.java --help
```
或者直接执行：
```
chmod +x Llama3.java
./Llama3.java --help
```
使用 Makefile 手动构建

项目提供了一个简单的 Makefile，可以运行 make 来生成 llama3.jar：
```
javac -g --enable-preview -source 21 --add-modules jdk.incubator.vector -d target/classes Llama3.java
jar -cvfe llama3.jar com.llama4j.Llama3 LICENSE -C target/classes .
```
生成的 jar 文件可以如下运行：
```
java --enable-preview --add-modules jdk.incubator.vector -jar llama3.jar --help
```
性能评估

在不同的硬件配置下，Llama3.java 的性能表现如下：

笔记本电脑 Intel 13900H

模型 tokens/s 实现
Llama-3-8B-Instruct-Q4_0.gguf 7.53 llama.cpp
Llama-3-8B-Instruct-Q4_0.gguf 6.95 llama3.java
Llama-3-8B-Instruct-Q8_0.gguf 5.16 llama.cpp
Llama-3-8B-Instruct-Q8_0.gguf 4.02 llama3.java

工作站 AMD 3950X

模型 tokens/s 实现
Llama-3-8B-Instruct-Q4_0.gguf 9.26 llama.cpp
Llama-3-8B-Instruct-Q4_0.gguf 8.03 llama3.java
Llama-3-8B-Instruct-Q8_0.gguf 5.79 llama.cpp
Llama-3-8B-Instruct-Q8_0.gguf 4.92 llama3.java

结论

Llama3.java 在 Java 环境中实现了高效的 Llama 3 模型推理，其单文件实现和简单的命令行界面使其具有很高的实用性。虽然在某些性能指标上与 llama.cpp 存在差距，但其在 Java 生态系统中的表现依然值得肯定。

参考文献
- GitHub – mukel/llama3.java
2024 年 6 月 1 日
谷歌投资20亿美元在马来西亚建设数据中心及云区域
根据马来西亚政府的宣布，美国科技巨头谷歌计划在马来西亚投资20亿美元，建设谷歌在该国的首个数据中心和谷歌云区域，同时推进人工智能领域的发展。这一投资使谷歌成为东南亚地区最新一家注入资金以寻求增长机会的科技巨头[1]。

以下是有关这一投资的详细信息：
1. 投资规模：谷歌将投资20亿美元（约合27亿新元）在马来西亚建设数据中心和云区域[1]。
2. 地点：数据中心和云区域将建在马来西亚雪兰莪州沙亚南的艾美娜商业园[1]。
3. 经济影响：这项投资预计将为马来西亚医疗保健、教育和金融领域提供2万6500个工作机会，并为制造业和服务业利用人工智能和其他先进技术提升全球价值链，创造约150亿4000万令吉（约43亿1600万新元）的经济总值[1]。
4. 谷歌的战略合作：这项投资是建立在谷歌与马来西亚政府合作推进“云优先政策”的基础上的，包括推动一流的网络安全标准[1]。
此外，谷歌的母公司Alphabet及谷歌的总裁兼首席投资官波拉特表示，这是谷歌在马来西亚运营13年来数额最大的投资计划，也是首次在该国设立数据中心和谷歌云区域[1]。

这项投资计划进一步证明了马来西亚政府的明确规划、国家的经济实力和资源，成功吸引了现有和新的投资者，有助于加速马来西亚的数码转型议程[1]。

Learn more:
2024 年 6 月 1 日
autoMate：用AI简化你的数字生活
引言

在这个数字化飞速发展的时代，我们的生活越来越依赖于各种软件和应用程序。但是，你有没有想过，如果这些软件能够更加智能，能够理解我们的指令并自动完成一些重复性的任务，那将会怎样？这就是autoMate所承诺的——它就像出行中的共享单车一样，只需3分钟，就能将AI的智能植入到任意一个软件中，让你的数字生活变得更加轻松和高效。

autoMate是什么？

autoMate是一个开源免费的项目，它允许用户通过简单的配置，将AI的能力集成到他们日常使用的软件中。无论是自动化工作流程，还是简化复杂的任务，autoMate都能提供强大的支持。

如何开始使用autoMate？

如果你是第一次使用autoMate，你只需要进行一些基础的设置。首先，你需要修改配置文件，添加OpenAI的信息。这可以通过在autoMate的左上角点击文件，然后选择components，接着配置OpenAI的相关信息来完成。

autoMate的主要功能

autoMate的核心功能是将AI集成到软件中，但它并不止步于此。以下是autoMate的一些主要功能：
- 自动化任务：autoMate可以帮助你自动化那些重复性高且耗时的任务。
- 智能决策：通过集成AI，autoMate能够提供智能的决策支持，帮助你更高效地完成工作。
- 易于配置：即使是没有编程背景的用户，也能够通过简单的配置快速上手autoMate。
各产品优势对比

autoMate在众多自动化工具中脱颖而出，它的优势在于其开源免费的特性，以及对AI能力的集成。这使得autoMate不仅能够帮助个人用户提高效率，也能够为企业提供强大的自动化解决方案。

开源社区的支持

autoMate完全依赖于开源社区的支持，这意味着它不断地在改进和更新。社区的贡献者们不断地为autoMate添加新功能，修复bug，确保它能够满足用户的需求。

结语

autoMate是一个强大的工具，它能够让你的软件更加智能，让你的工作更加高效。无论你是希望简化日常任务，还是想要探索AI的潜力，autoMate都是一个值得尝试的选择。而且，由于它是开源免费的，你没有任何理由不试试这个能够改变你数字生活的神奇工具。

呼吁行动

如果你对autoMate感兴趣，不妨访问它的GitHub页面，那里有详细的安装指南和使用文档。同时，如果你觉得autoMate对你有帮助，不妨给它点个star，以示对开源项目的支持和鼓励。
2024 年 6 月 1 日
一群中国年轻人的留学之路：机会变窄了？
中国年轻人面临的留学困境

近年来，越来越多的中国年轻人希望出国留学，追求更广阔的学术和职业发展机会。然而，他们发现出国留学的路越来越窄了。无论是申请奖学金还是签证审查，都面临着越来越多的困难。

根据《知识分子》援引的一些个人经历，中国学生在申请奖学金时往往发现，他们感兴趣的领域在美国是最发达、最前沿的，但由于种种原因，申请到这些实验室的机会变得非常有限。很多国家也开始提高留学生的审查门槛，一些大学和研究机构参与其中。

除了奖学金申请的困难，学生还面临着签证审查的问题。有些学生被要求进行安全调查，有的甚至中途被退学。签证审查的时间也越来越长，有的甚至需要等待数年。一些学生在境外留学期间甚至遭遇了盘查和审问，他们的个人隐私和学术资料都受到了审查。

影响学术发展和人生规划

这些限制和审查对中国年轻学者的学术发展和人生规划产生了负面影响。一些学者发现，他们无法在自己感兴趣的领域进行研究，一些合作项目也因为政治原因受阻。年轻学者在面对地缘政治的变化时往往处于不利地位，他们可能未能完成必要的国际学术交流和社会资本积累。

这种局面不仅对留学生产生了影响，也对学术界和科研领域造成了破坏。一些教授和学者因政策变化而受到限制，一些高校面临着来自政府和舆论的压力，导致学术交流受到新的审查。一些高校的部门甚至不得不考虑降低招收学生的标准。

选择的困境和趋势

中国年轻学生在面对这些困境时，不得不重新考虑自己的选择。越来越多的学生选择放弃美国，转向其他国家或选择在国内继续深造。一些学生认为，在国内的顶尖高校能够提供更好的学术机会和资源，而且能与家人更加接近。同时，一些国家如新加坡也成为留学的热门目的地。

然而，这种趋势也引发了一些担忧。一些学者认为，这些限制和审查可能导致学术竞争的不公平，一些领域的学术发展受到了阻碍。年轻学者可能无法获得必要的国际学术交流和社会资本积累，影响了他们的学术发展。

结论

中国年轻人出国留学的机会正在变得越来越窄。越来越多的学生面临奖学金申请的困境，签证审查的挑战，以及学术发展受阻的问题。这对年轻学者的学术规划和人生选择带来了负面影响。

然而，我们也不能忽视这种困境中的机遇。在选择留学的时候，学生们需要更加灵活和机智，寻找适合自己的机会和发展路径。虽然某些国家的机会变少了，但其他一些国家和地区仍然提供了良好的学术环境和机会。同时，在国内的顶尖高校也能够提供丰富的学术资源和发展机会。

无论面对怎样的困境，年轻学者们应该保持积极的心态，并寻找适合自己发展的道路。学术领域的发展和人生规划需要时间和努力，即使面临困难，也要坚持追求自己的梦想。

参考文献：
1. 苏惟楚, 严胜男, 冀思宇. “一种生活]一群中国年轻人的亲身经历：出国留学的路，越来越窄了”. 喷嚏小乖, 2024, 5月9日.
2. 张紫薇. “中国留学生出国交流遇阻，越来越窄的机会”. 知识分子, 2024.
2024 年 6 月 1 日
网约车司机的艰辛生存：月挣1.5万才能养家，连续5天睡车里

在中国的繁华都市中，网约车行业正迅速发展，成为许多人的主要收入来源。然而，对于许多网约车司机来说，这个行业越来越难以维持生计，挣钱变得越来越艰难。他们不得不面对日益激烈的竞争和订单量的减少，为了维持家庭生计，他们必须制定各种策略来增加收入和降低成本。

李师傅（化名）是一位在北京从事网约车司机工作的普通人，他的故事反映了许多网约车司机所面临的压力和艰辛。为了能够养家糊口，李师傅设定了每月至少需要挣到1.5万元的目标收入。然而，要实现这一目标并不容易。

为了降低开支，李师傅严格控制自己的生活费用。他将每天的三餐控制在30元以内，日常开销不超过100元。对于一个有两个孩子的家庭来说，这样的开销限制非常严苛，但对于李师傅来说，这是为了能够顾及家庭和生计的必要措施。

李师傅为了节约成本，创造了自己的接单策略。他通过多个网约车平台轮流接单，错峰出车，以减少空驶的时间。他还深入研究团购券，寻找最划算的午餐，甚至蹭过滴滴公司的食堂早餐。为了节约住宿费用，他曾连续五天睡在自己的车里，备有洗脸盆、毛巾、牙刷等生活用品。他不得不在艰苦的条件下过夜，以节省资金和时间。

然而，即使在如此努力的情况下，李师傅发现网约车行业的订单量越来越少，竞争也越来越激烈。他表示，很多司机都在感叹挣钱变得越来越难，而且越来越多的人发现这个行业并不是轻松赚钱的方式。

根据中国交通运输部的数据，截至2023年底，中国网约车司机数量已经达到657.2万，一年新增了148.2万名司机。这个庞大的数量使得竞争激烈，司机们不得不想尽办法来脱颖而出。

李师傅认为，要在这个行业中谋生，不仅要有良好的驾驶技巧，还需要对规则有着深刻的理解，并善于利用规则来增加收入。他发现，掌握高峰期的订单，选择划算的团购餐券，以及灵活应对不同的接单平台都是提高收入的有效策略。

然而，即使李师傅采取了这些策略，他也不得不面对订单量下降的现实。为了增加收入，他不得不加班到深夜，接送刚玩完的乘客。他在北京的繁华地段穿梭，从大厂门口到国贸、三里屯附近，不停地接单。他甚至愿意在凌晨时分睡在车里，以便在早上第一时间开始工作。

然而，李师傅和很多网约车司机一样，他的努力并不总是能带来理想的结果。他发现，由于订单减少和竞争加剧，他的收入难以达到目标。为了应对这一困境，他不得不经常调整策略，尝试不同的接单方式和工作时间。

网约车司机的艰辛生存状况引发了对整个行业的思考。随着网约车行业的迅速扩张，一些问题也浮出水面。一方面，乘客享受了便捷的出行服务，但另一方面，司机们面临着低收入、高竞争和不稳定的工作条件。

政府和相关平台也意识到了这个问题，并采取了一些措施来改善司机的工作环境和收入状况。然而，要解决这个问题并不容易，需要各方共同努力，包括政府、平台和司机自身。

对于李师傅和许多网约车司机来说，网约车行业是他们维持生计的重要途径，但同时也是一段充满挑战和艰辛的旅程。他们不得不面对日益激烈的竞争和不确定的收入，努力寻找生存和发展的机会。

然而，他们的辛勤努力和奉献精神也值得我们的尊重和关注。他们为城市的出行提供了重要的服务，同时也承受着许多压力和牺牲。在社会的关注和支持下，希望网约车司机们能够找到更好的发展机会，实现自身的生活目标。

2024 年 6 月 1 日
昨日像那东流水——房地产行业的起伏与命运
初识老宋

前几年，我在杭州偶遇了一些行业中的老朋友。那次聚会是在九溪的玫瑰园酒店，正值早春三月，孔雀在草地上悠闲地行走。人群中，我第一次见到了老宋。那是2010年，他意气风发，坐在行业的第二把交椅上，豪言要超越万科。然而，十几年一晃而过，行业跌宕起伏，万科陷入各种传言，他曾经的兄弟孙宏斌也如流星般陨落。

老宋似乎已经远离了这些纷扰，每天中午他会晃悠到酒店的走廊上抽烟，专注于自己的事。他的头发已经花白，远离聚光灯多年。饭桌上，大家谈论过去的人和事，像王小波写过的那句话：“躺在河底，看着潺潺流水、波光、落叶、浮木、空酒瓶，一样样从身上流过去。”

滨江的崛起与独特性

杭州房企滨江近日被传将被杭州国企收购。就在前几天，滨江的老板戚金兴和夫人还在杭州淳安县的山上接待了业主们。戚老板说，山上空气清新，人也能保持清醒。过去两年，他和其他房地产从业者似乎不是一个时代的。

滨江的独特性非常明显：60%的土地储备在杭州，85%的土储在浙江。2023年，滨江1076人管理了120个项目，卖了1534亿，人均销售额达到了1.43亿元。它的合伙伙伴也忠实、稳固，带着一帮小兄弟拿地，合作开发，有钱，有品质。滨江继承了绿城的营造质量和客户口碑，但在人均产出、成本控制和周转速度上，比绿城做得更好。

戚金兴的战略与忧虑

戚金兴一直是行业内敢公开表达的人。在绿城老宋半隐退的日子里，他扛起了浙江地产商的大旗，直截了当地批评同行业绩造假，并对市场进行预测。他松弛地讲着大实话，听起来像凡尔赛。2023年，滨江最低一笔项目贷款是2.2%，戚老板说：“有时候我都觉得难为情。”

然而，他对后市非常不乐观，说房地产的丰产期已经过了：“我现在的战略是，其他城市再有诱惑力，也不去了，保住现在的成果。”

杭州的地产热潮

2015年后，杭州全是利好。阿里巴巴上市，杭州从工业经济向信息经济转型，人口每年飙涨十几万。2016年9月，杭州成功举办了G20，城市开始大规模的更新建设，拆迁了十几万户。新增人口需要住房，拆迁户也需要住房。2017年，杭州卖掉了17万套房子，很多人都是一次性付款。

从2016年开始，杭州成为中国最热的土拍城市，房企争相来到这里竞技。2016年到2023年，杭州总土地收入超过1.8万亿，全国遥遥领先。滨江在杭州的土拍市场上一直断崖式领先，过去八年，总投资超过了2000亿。

风险与挑战

然而，2022年开始，杭州外围市场明显冷清。滨江去的临平、萧山临浦、临安、富阳甚至良渚、龙坞都成了高库存重灾区。2023年，滨江以自己的名义拿了15宗地，近10个项目综合新开盘去化率都低于50%。

这些年，同行对标学习滨江也取得了一些成果。绿城和建发已经学到了滨江的精髓，拿完地后迅速推进项目。

结语

今年前四月，滨江以355亿，排名中国房企销售额第八。戚老板竟然成了中国民营房企第一名，财务状况和资产状况比其他人好得多。然而，滨江仍然传出将被国企收购的流言，这意味着在资本市场和业内看来，在当下已没有绝对安全的地产商了。标普上周选取了18家房企作为样本，进行压力测试，发现各类所有制样本房企均偿债能力不足，包括国企。

走到一个时代的末尾，不堪其重的人，都像一片羽毛，轻轻飞出窗外。几个月前，我一个企业家朋友偶遇了旭辉老板林中，林中告诉朋友，他和弟弟都抑郁了，弟弟更严重一些，所以辞任了。满头白发的胡葆森也曾对林中说：“我马上70岁了，还不一样。”

参考文献
1. 喷嚏小乖. (2024). 一种生活：兽爷丨昨日像那东流水. [在线文章] 发布于 2024-5-7 22:11:00.
2024 年 6 月 1 日
从底层程序员到失意的IT培训学员

前言

一直以来,程序员这个职业在许多人眼中都是高富帅的代名词。通过IT培训学校,普通人也能迅速切入这个行业,成为软件开发的编程工人。但在现实中,这些底层程序员们往往只能沦为外包公司的代码搬运工,无法实现自我提升和价值实现。本文通过几个典型案例,探讨了普通人进入IT行业的艰辛历程,以及培训学校和外包公司对他们造成的种种困境。

培训学校的”神话”与现实

孙玲是众多IT培训学员心中的”神话”。她从一名深圳流水线厂妹,通过不懈努力,最终成长为纽约的高薪程序员。这种”逆袭”的人生轨迹,激发了许多普通人的梦想。

但事实证明,孙玲只是少数幸运儿。对于大多数学员来说,在培训学校所学的知识往往只是皮毛,无法满足互联网公司日新月异的技术要求。培训学校为了招揽学生,不惜使用”应试教育”的手法,教授一些过时且简单的编程知识,仅仅是为了应付面试。

随着行业变革,头部互联网公司对员工的技术要求越来越高,普通培训学校难以跟上步伐,反而被淘汰出局。许多原本报考的学生,最终只能进入人力外包公司,沦为代码搬运工,无法实现自我价值。

外包公司:编码的”送外卖”

进入外包公司后,许多底层程序员发现自己的处境并没有太大改变。他们不得不连续加班完成一个又一个项目,却无法掌控最终产品的走向。就像一位员工所说,”就像对着空气敲代码”。

缺乏成就感和发展空间,使得许多员工对未来失去信心。有的人干脆选择辞职,去送外卖或做其他工作,因为那样”至少不用整天写些脏东西”。

失意的IT培训学员

无论是孙玲这样的成功典型,还是陷入困境的普通学员,他们的经历都给我们一个深刻启示:IT培训学校并非通往程序员”圣殿”的捷径,而是一条充满荆棘的道路。

如果没有扎实的编程基础和持续学习的决心,普通学员很难在这个行业立足。外包公司的无奈处境,也让我们看到了IT培训学校的局限性。

也许,对于大部分普通人来说,IT行业的”神话”终究只是一个遥不可及的梦想。我们需要更加务实地看待自己的处境,选择适合自己的人生道路,而不是盲目地追求那些虚幻的前景。

2024 年 6 月 1 日
《万历十五年》: 重写历史的艺术
20世纪最后几十年间,中国大陆和台湾读者心目中最有影响力的历史学家,非黄仁宇莫属。他的代表作《万历十五年》,从一个平凡无奇的年份出发,绘制了明王朝兴衰的全景。这部充满激情和才华的作品,打破了学术界的定式,为读者呈现了一种全新的历史叙事方式。

我们可以从以下几个方面来解析这部经典之作的成功之处:
1. 把握时代脉搏,迎合读者需求。在改革开放初期,中国历史学界普遍呈现僵化、沉闷的局面。《万历十五年》的出现,让读者重新感受到历史的生动性和多元性,引发了广泛关注。
2. 独特的叙事策略。黄仁宇选择了一个平淡无奇的年份,通过六个人物的失败故事,生动地展现了明王朝的内在矛盾和必然消亡。人物性格鲜明,情节引人入胜,这种”以人物为中心”的叙述方式深受读者欢迎。
3. 清晰的历史观。黄仁宇提出,中国之所以落后于西方,关键在于传统政治体制的弊端 —— 组织简单、效率低下,而缺乏应对现实问题的能力。这种”大历史观”为读者提供了一个简单明了的通史框架。
4. 作者独特的个人经历。”半路出家”的黄仁宇,既没有被学术圈的”规矩”所驯化,又保持着对历史的草根式兴趣。他的作品都源于自身的生命体验,富有强烈的个性特色,这正是它广受读者欢迎的重要原因。
然而,黄仁宇的成功并未获得学界的一致认可。他的”大历史观”和散文化的写作风格,被一些正统学者视为”粗糙”、”不严谨”。他们认为黄仁宇缺乏扎实的学术功底,其作品”史学价值甚微”。

这种对立反映了当代史学研究日益专业化、封闭化的弊端。学界过度强调考证、分析,忽视了历史研究的”致用”价值。而像黄仁宇这样的”半路出家”,却往往能更好地把握时代脉搏,以通俗易懂的方式,满足普通读者对历史知识的需求。

“黄仁宇现象”无疑为历史学界敲响了警钟。我们应该反思,史学研究究竟应该为谁服务?是应该自我封闭,沉浸于学术殿堂,还是应该主动走向社会,实现知识的普及和传播?相信通过这些反思,历史学必将迈向一个更加开放、活跃的新纪元。

《黄仁宇与”大历史观”》

我们从前辈历史学者黄仁宇的传奇人生经历和著作《万历十五年》的创作历程中,可以看出一个重要的启示:历史研究应该跳出狭隘的学术殿堂,真正服务于广大读者。

黄仁宇先生生平大起大落,从十四岁就开始在报刊发文,十八岁就读南开理工,后来又投身抗战,负伤入美深造,最终成为历史学者。他的人生经历丰富多彩,一度在学术界遭受冷遇和解聘,但凭借自己独特的”大历史观”,最终在普通读者中大获成功。

黄先生的代表作《万历十五年》,在首次投稿时遭到美国众多出版社的退稿,原因是这部作品在学术界看来”不伦不类”,既不像传统的历史专著,也不像学术论文。但就是这种混合了散文、小说和学术论述的独特写法,反而深受普通读者的喜爱。这部被视为”历史界的琼瑶”的作品,在大陆和台湾迅速成为畅销书,直至今日依然影响力巨大。

造成这一现象的关键在于,黄仁宇保持了强烈的个性和独特视角,他的历史研究不仅是为了解决学术问题,更多地源自于对个人生命困惑的思考。他的”大历史观”虽然遭到学界主流的批评,但却很好地契合了普通读者迫切了解中国历史全貌的需求。他巧妙地将复杂的历史事件转化为一个个生动动人的故事,引发读者的强烈共鸣。

与此同时,学界对黄仁宇的抵触也反映出了当代史学研究的一些问题。在学术日益专业化的今天,不少历史学者过于注重考据和分析技巧,忽视了学术研究的”致用”价值,史学也越来越远离广大读者。这种状况下,黄仁宇这样的”半路出家”反而能够保持敏锐的问题意识和广阔的视野,为普通读者提供新鲜而动人的历史叙述。

可以说,”黄仁宇现象”给予我们的启示是:历史研究应该跳出狭小的学术场域,真正服务于社会,回应普通大众的需求。我们需要更多像黄仁宇一样,能够将深厚的学识转化为通俗易懂的著作,让历史学真正发挥其独特魅力,引发社会各界的广泛关注和热烈讨论。只有这样,历史研究才能真正担当起应尽的社会责任。
2024 年 6 月 1 日

模型	tokens/s	实现
Llama-3-8B-Instruct-Q4_0.gguf	7.53	llama.cpp
Llama-3-8B-Instruct-Q4_0.gguf	6.95	llama3.java
Llama-3-8B-Instruct-Q8_0.gguf	5.16	llama.cpp
Llama-3-8B-Instruct-Q8_0.gguf	4.02	llama3.java

模型	tokens/s	实现
Llama-3-8B-Instruct-Q4_0.gguf	9.26	llama.cpp
Llama-3-8B-Instruct-Q4_0.gguf	8.03	llama3.java
Llama-3-8B-Instruct-Q8_0.gguf	5.79	llama.cpp
Llama-3-8B-Instruct-Q8_0.gguf	4.92	llama3.java

月度归档： 2024 年 6 月

GRPO方法是如何工作的？

1. 群体信息整合

2. 最坏情况性能优化

3. 自适应权重调整

4. 理论分析与算法设计

5. 实验验证

GRPO方法的应用前景和未来工作

引言

S3D方案解决的问题

相关研究

S3D方案的关键内容

实验验证

进一步的研究方向

结论

引言

ANAH数据集：详细注释LLMs中的幻觉

幻觉问题的研究进展

未来的研究方向

结论

引言

ICE协议的原理和作用

ice4j项目的特点和用途

ice4j的应用举例

什么是 ActivityPub？

基本概念

客户端到服务器的交互

发布活动示例

接收消息

服务器到服务器的交互

示例：服务器间的消息传递

安全性与认证

验证示例

结论

参考文献

什么是ActivityPub

ActivityStreams：社交网络的共同词汇

ActivityPub的工作原理

ActivityPub的工作进展

ActivityPub的应用案例

ActivityPub的未来发展

引言

安装应用程序

导出应用程序

模板

结论

参考文献

引言

JBang的文件组织方式

使用多个源文件的高级功能

添加更多资源文件

用于命令行插件的无扩展名/非Java文件

结论

参考文献

引言

JBang简介

安装和使用JBang

指定和管理依赖项

内联注释方式

外部依赖文件方式

解析和安装依赖项

示例说明

结论

参考文献

简介

安装

使用方法

依赖关系

Java版本

文件组织

运行和调试

编辑

导出和发布

依赖项

前言

什么是 JBang？

多平台支持

安装与运行

无需预装 Java

嵌入式依赖管理