All Stories
在96个H100 GPU上部署DeepSeek
本文介绍了如何使用SGLang在12节点、每节点8个H100 GPU的集群上,实现DeepSeek大语言模型的高效推理。通过采用prefill-decode解耦和大规模专家并行(EP)等技术,SGLang实现了每秒52.3k输入令牌和22.3k输出令牌的性能,接近官方DeepSeek报告中的吞吐量。文章详细介绍了并行设计、优化方法和结果,并提供了所有实验代码...
Aug 29, 2025The Four Styles of Confidence on a Team
本文探讨了团队中四种常见的自信风格,并分析了它们对团队的影响。文章首先定义了四种自信风格:过度自信、缺乏自信、中等自信和比例自信。作者认为,比例自信是最佳风格,因为它能够准确估计自己观点的正确性,并将其传达给他人。文章进一步分析了如何克服过度自信和缺乏自信,并提出了管理者如何构建具有比例自信的团队的建议。
Aug 28, 2025请愿书:停止谷歌限制侧载和开源软件(FOSS)应用
谷歌将仅允许经过验证的开发者安装Android设备上的应用,引发了一项由开发者发起的请愿活动,要求停止此限制政策除非开发者提供个人身份证明。此举可能威胁到在不泄露敏感个人信息的情况下构建、分享和使用软件的自由,影响独立开发者、开源贡献者和希望安装非Google Play应用的普通用户。请愿呼吁大家共同保护软件创作和使用的自由,并呼吁签名、分享和发声支持。
Aug 28, 2025针对可维护性进行优化 - 在Strand的生产中使用Gleam
Strand是一家位于伦敦的营销机构,专注于为企业技术公司提供文案和内容创作服务。由于业务增长,公司决定开发新的财务管理系统以支持业务运营。他们选择了Gleam语言来构建系统,因为Gleam的稳健性、可维护性以及强大的开发者体验。Gleam的BEAM运行平台提供了容错能力,使得系统即使在遇到外部服务问题时也能保持稳定运行。通过逐步采用Gleam,Strand...
Aug 28, 2025启动 HN:Dedalus Labs(YC S25)- 代理的 Vercel
Dedalus Labs推出了一款云平台,旨在帮助开发者构建具有智能功能的AI应用。该平台简化了将大型语言模型(LLM)与多种工具集(MCP)集成的过程,无需复杂的配置。开发者可以通过简单的API调用,快速将工具和服务集成到他们的AI应用中。Dedalus Labs还提供了开源的SDK,支持Python、TypeScript和Go等编程语言。目前,Dedal...
Aug 28, 2025Fossjobs: 一个免费和开源工作的招聘网站
这是一个专门发布付费开源工作信息的招聘平台。仅限于列出那些改进和参与FOSS(免费和开源软件)或开源硬件项目的组织的职位。仅仅在工作中使用开源技术是不够的。职位列表免费,可以提交找到的工作,也可以发送职位链接至fossjobs.net。平台支持Mastodon、IRC、RSS订阅和GitHub。
Aug 28, 2025绘制 Form Ds 的图表,大致了解风险投资“基金”的筹集情况。
本文分析了2022年后期至2025年8月期间风险投资行业的变化,指出了一种被忽视的创业泡沫。作者通过分析SEC文件中的Form D提交数量,发现以“基金I”、“基金II”等命名的实体在2022年第三季度达到顶峰后迅速下降。作者认为,这反映了风险投资行业在2020年代初期的快速增长,随后由于利率上升和资金募集难度增加而放缓。文章预测,随着资金供应减少,估值将下...
Aug 28, 2025OpenAI 和 Anthropic 在推理上是否在亏损?
本文分析了大规模运行 AI 推理的成本和经济性,认为推理成本被夸大了。作者通过计算和假设,指出输入处理成本远低于输出生成成本,导致某些应用模式(如代码助手、文档分析工具)具有极高的盈利潜力。同时,作者警告过度强调成本可能阻碍竞争和创新,并呼吁关注 AI 推理的潜在经济价值。
Aug 28, 2025我们使用系统倡议重新构建了Cloud Life的基础设施交付
Cloud Life通过引入System Initiative(SI)系统,消除了静态配置文件,从而显著缩短了交付时间,提高了可靠性,并使工程师的工作更加顺畅和易于管理。通过优化反馈循环,即时可见和测试更改,SI帮助Cloud Life实现了从“基础设施即代码”到“基础设施即协作”的转变。这种方法减少了配置文件编写、审查和合并的等待时间,并提高了资源部署的效...
Aug 27, 2025系统倡议将人工智能代理添加到基础设施自动化平台
System Initiative公司宣布在其基础设施自动化平台中加入了自主人工智能(AI)代理。这些AI代理可以与IT基础设施环境的数字孪生进行交互,帮助DevOps团队安全地提出和执行对IT基础设施的变更。通过自然语言提示,DevOps工程师可以指示平台期望的结果,AI代理将决定如何实现该任务。AI代理能够在几分钟内完成原本需要几周时间手动执行的任务。此...
Aug 27, 2025SpaceX的巨型火星火箭Starship成功完成第10次关键测试飞行
SpaceX的Starship巨型火箭于2025年8月26日进行了第10次飞行,这是该公司从最近的失败中强劲反弹的一次大胆测试飞行。Starship是迄今为止建造的最大、最强大的火箭,今天从德克萨斯州SpaceX的Starbase基地成功发射。这次飞行是在多次延误和问题之后进行的,包括地面系统问题、天气原因以及之前的失败。Starship在本次飞行中完成了所...
Aug 27, 2025启动 HN:Bitrig(YC S25)- 在您的 iPhone 上构建 Swift 应用
Bitrig是一个基于AI的移动应用开发平台,允许用户通过聊天的方式创建原生Swift手机应用。它简化了Swift应用的开发过程,让开发者能够直接在手机上预览和分享应用。Bitrig使用Claude Sonnet 4.0技术生成原生Swift代码,并通过自定义Swift解释器实现即时预览和分享功能。此外,用户可以通过Bitrig连接Apple开发者账户,将应...
Aug 27, 2025将您的代理带到 Zed - 携带 Gemini CLI
Zed编辑器现在可以直接与第三方代理进行交互,为此创建了代理客户端协议(ACP),并与Google合作将Gemini CLI作为初始参考实现。该协议旨在让开发者能够在不切换编辑器的情况下,在多个代理之间切换。Gemini CLI团队在Zed的集成终端中使用其代理时获得了良好的体验,并希望探索更深入的集成。Zed定义了一组最小的JSON-RPC端点来将用户请求...
Aug 27, 2025AI原生基础设施自动化
本文介绍了System Initiative如何通过其自定义AI代理简化负载均衡器的更新过程。AI代理能够自动发现负载均衡器,分析其配置,并提出更激进的更新建议。用户可以审查这些建议并应用更改。整个过程是安全、可重复和自动化的,有助于实现基础设施的自动化管理。System Initiative还展示了其在其他基础设施自动化任务中的应用,如处理生产中断、自动化...
Aug 27, 2025- « Prev
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
- 65
- 66
- 67
- 68
- 69
- 70
- 71
- 72
- 73
- 74
- 75
- 76
- 77
- 78
- 79
- 80
- 81
- 82
- 83
- 84
- 85
- 86
- 87
- 88
- 89
- 90
- 91
- 92
- 93
- 94
- 95
- 96
- 97
- 98
- 99
- 100
- 101
- 102
- 103
- 104
- 105
- 106
- Next »