All Stories

在96个H100 GPU上部署DeepSeek

本文介绍了如何使用SGLang在12节点、每节点8个H100 GPU的集群上,实现DeepSeek大语言模型的高效推理。通过采用prefill-decode解耦和大规模专家并行(EP)等技术,SGLang实现了每秒52.3k输入令牌和22.3k输出令牌的性能,接近官方DeepSeek报告中的吞吐量。文章详细介绍了并行设计、优化方法和结果,并提供了所有实验代码...

Aug 29, 2025

可信代理商业协议

内容涉及 Forter 的可信代理商业协议(Trusted Agentic Commerce Protocol),但无法在此时刻执行相关操作。

Aug 28, 2025

The Four Styles of Confidence on a Team

本文探讨了团队中四种常见的自信风格,并分析了它们对团队的影响。文章首先定义了四种自信风格:过度自信、缺乏自信、中等自信和比例自信。作者认为,比例自信是最佳风格,因为它能够准确估计自己观点的正确性,并将其传达给他人。文章进一步分析了如何克服过度自信和缺乏自信,并提出了管理者如何构建具有比例自信的团队的建议。

Aug 28, 2025

请愿书:停止谷歌限制侧载和开源软件(FOSS)应用

谷歌将仅允许经过验证的开发者安装Android设备上的应用,引发了一项由开发者发起的请愿活动,要求停止此限制政策除非开发者提供个人身份证明。此举可能威胁到在不泄露敏感个人信息的情况下构建、分享和使用软件的自由,影响独立开发者、开源贡献者和希望安装非Google Play应用的普通用户。请愿呼吁大家共同保护软件创作和使用的自由,并呼吁签名、分享和发声支持。

Aug 28, 2025

针对可维护性进行优化 - 在Strand的生产中使用Gleam

Strand是一家位于伦敦的营销机构,专注于为企业技术公司提供文案和内容创作服务。由于业务增长,公司决定开发新的财务管理系统以支持业务运营。他们选择了Gleam语言来构建系统,因为Gleam的稳健性、可维护性以及强大的开发者体验。Gleam的BEAM运行平台提供了容错能力,使得系统即使在遇到外部服务问题时也能保持稳定运行。通过逐步采用Gleam,Strand...

Aug 28, 2025

启动 HN:Dedalus Labs(YC S25)- 代理的 Vercel

Dedalus Labs推出了一款云平台,旨在帮助开发者构建具有智能功能的AI应用。该平台简化了将大型语言模型(LLM)与多种工具集(MCP)集成的过程,无需复杂的配置。开发者可以通过简单的API调用,快速将工具和服务集成到他们的AI应用中。Dedalus Labs还提供了开源的SDK,支持Python、TypeScript和Go等编程语言。目前,Dedal...

Aug 28, 2025

Fossjobs: 一个免费和开源工作的招聘网站

这是一个专门发布付费开源工作信息的招聘平台。仅限于列出那些改进和参与FOSS(免费和开源软件)或开源硬件项目的组织的职位。仅仅在工作中使用开源技术是不够的。职位列表免费,可以提交找到的工作,也可以发送职位链接至fossjobs.net。平台支持Mastodon、IRC、RSS订阅和GitHub。

Aug 28, 2025

绘制 Form Ds 的图表,大致了解风险投资“基金”的筹集情况。

本文分析了2022年后期至2025年8月期间风险投资行业的变化,指出了一种被忽视的创业泡沫。作者通过分析SEC文件中的Form D提交数量,发现以“基金I”、“基金II”等命名的实体在2022年第三季度达到顶峰后迅速下降。作者认为,这反映了风险投资行业在2020年代初期的快速增长,随后由于利率上升和资金募集难度增加而放缓。文章预测,随着资金供应减少,估值将下...

Aug 28, 2025

OpenAI 和 Anthropic 在推理上是否在亏损?

本文分析了大规模运行 AI 推理的成本和经济性,认为推理成本被夸大了。作者通过计算和假设,指出输入处理成本远低于输出生成成本,导致某些应用模式(如代码助手、文档分析工具)具有极高的盈利潜力。同时,作者警告过度强调成本可能阻碍竞争和创新,并呼吁关注 AI 推理的潜在经济价值。

Aug 28, 2025

我们使用系统倡议重新构建了Cloud Life的基础设施交付

Cloud Life通过引入System Initiative(SI)系统,消除了静态配置文件,从而显著缩短了交付时间,提高了可靠性,并使工程师的工作更加顺畅和易于管理。通过优化反馈循环,即时可见和测试更改,SI帮助Cloud Life实现了从“基础设施即代码”到“基础设施即协作”的转变。这种方法减少了配置文件编写、审查和合并的等待时间,并提高了资源部署的效...

Aug 27, 2025

系统倡议将人工智能代理添加到基础设施自动化平台

System Initiative公司宣布在其基础设施自动化平台中加入了自主人工智能(AI)代理。这些AI代理可以与IT基础设施环境的数字孪生进行交互,帮助DevOps团队安全地提出和执行对IT基础设施的变更。通过自然语言提示,DevOps工程师可以指示平台期望的结果,AI代理将决定如何实现该任务。AI代理能够在几分钟内完成原本需要几周时间手动执行的任务。此...

Aug 27, 2025

SpaceX的巨型火星火箭Starship成功完成第10次关键测试飞行

SpaceX的Starship巨型火箭于2025年8月26日进行了第10次飞行,这是该公司从最近的失败中强劲反弹的一次大胆测试飞行。Starship是迄今为止建造的最大、最强大的火箭,今天从德克萨斯州SpaceX的Starbase基地成功发射。这次飞行是在多次延误和问题之后进行的,包括地面系统问题、天气原因以及之前的失败。Starship在本次飞行中完成了所...

Aug 27, 2025

启动 HN:Bitrig(YC S25)- 在您的 iPhone 上构建 Swift 应用

Bitrig是一个基于AI的移动应用开发平台,允许用户通过聊天的方式创建原生Swift手机应用。它简化了Swift应用的开发过程,让开发者能够直接在手机上预览和分享应用。Bitrig使用Claude Sonnet 4.0技术生成原生Swift代码,并通过自定义Swift解释器实现即时预览和分享功能。此外,用户可以通过Bitrig连接Apple开发者账户,将应...

Aug 27, 2025

将您的代理带到 Zed - 携带 Gemini CLI

Zed编辑器现在可以直接与第三方代理进行交互,为此创建了代理客户端协议(ACP),并与Google合作将Gemini CLI作为初始参考实现。该协议旨在让开发者能够在不切换编辑器的情况下,在多个代理之间切换。Gemini CLI团队在Zed的集成终端中使用其代理时获得了良好的体验,并希望探索更深入的集成。Zed定义了一组最小的JSON-RPC端点来将用户请求...

Aug 27, 2025

AI原生基础设施自动化

本文介绍了System Initiative如何通过其自定义AI代理简化负载均衡器的更新过程。AI代理能够自动发现负载均衡器,分析其配置,并提出更激进的更新建议。用户可以审查这些建议并应用更改。整个过程是安全、可重复和自动化的,有助于实现基础设施的自动化管理。System Initiative还展示了其在其他基础设施自动化任务中的应用,如处理生产中断、自动化...

Aug 27, 2025