AI 每日热点 · 2026-05-22

🔬 AI 新工艺

1. 用 Gemma 4 31B 在 5 年前的 M1 Max 上本地索引一年视频素材
一篇高质量工程实践博客,作者用 Claude Code 写了约 1400 行 Python 流水线,在 2021 款 MacBook Pro M1 Max(64GB)上跑了 Gemma 4 31B Q4,高峰期 swap 冲到 50GB,硬是把一整年的摄像机素材标注成了可搜索的视频档案。核心架构:ffprobe 提取元数据 → exiftool 读 GPS → WhisperX 多语言转录 + 说话人分离 → insightface 人脸嵌入 → vision model 单次调用输出完整 YAML 侧边描述文件。和你在用的 Agent Plan 模式不同在于,这里 Claude Code 是开发者,架构设计(哪个环节用自动化、哪个环节用 LLM)才是主产出——典型的上游杠杆思维。
https://blog.simbastack.com/indexed-a-year-of-video-locally/

2. Simon Willison:过去六个月 LLM 发生了什么 — 5 分钟速读
梳理了 LLM 半年关键进展:多模态能力成熟、Agent 框架从概念走向实用、小模型(<10B)崛起、开源生态逼近闭源水平。适合快速补课建立全景认知。
https://simonwillison.net/2026/May/19/5-minute-llms/


🛠️ 工具及技巧

1. smallcode – 面向小型 LLM 的编码 Agent,4B 模型跑到 87% 基准
新开源项目,把编码 Agent 的工作流压缩到适配 4B 激活参数的模型,在 SWE-bench 等基准上达到 87%。适合本地/边缘部署场景,和你在用的 Agent 开发模式搭配可做低成本验证。
https://github.com/Doorman11991/smallcode

2. Runtime (YC P26) – 团队的沙箱化编码 Agent 平台
一个 YC 孵化的控制平面,让整个团队(不止研发)都能在沙箱里跑 Claude Code、Codex、Gemini CLI,从 Slack/Linear/CLI 触发,自带 guardrails、审计日志和企业集成。
https://www.runtm.com/

3. 花 $48K 买 GPU 服务器跑推理,值不值? ♻️ 重推自 2026-05
作者自购并自建了一台专用 GPU 服务器,分享了大半年跑 AI 推理的真实成本与体验——电费、散热、维护、利用率。结论:自建适合持续满载的场景,间歇性需求还是 API 划算。
https://rosmine.ai/2026/05/13/was-my-48k-gpu-worth-it/


⭐ 开源亮点

1. html-anything — 4470⭐,本地 Agent 驱动的 HTML 编辑器,75 个技能 × 9 种输出格式(杂志、PPT、简历等)
https://github.com/nexu-io/html-anything

2. mirage — 为 AI Agent 构建的统一虚拟文件系统,跨平台管理资源
https://github.com/strukto-ai/mirage

3. clawsweeper — AI 驱动的 Issue/PR 清理工具,自动扫描仓库建议关闭项
https://github.com/openclaw/clawsweeper

4. datawhalechina/Agent-Learning-Hub — 475⭐,Datawhale 出品的 AI Agent 学习路线与资料库
https://github.com/datawhalechina/Agent-Learning-Hub


📰 行业动态

1. Karpathy 宣布加入 Anthropic,AI 领域人才格局再变
2. Mistral AI 收购 Emmi AI,欧洲 AI 模型层整合加速
3. OpenAI 采用 Google SynthID 水印技术,为 AI 图像添加内容溯源验证


🚀 重磅发布

1. Google 发布 Gemini 3.5 Flash,性能与效率显著提升

↑ Back to list
Apps
About Me
GitHub: Trinea
Facebook: Dev Tools
AI Daily Digest