欢迎来到 AioGeoLab | GEO优化实验室 👋

追踪全球顶级GEO一手实践洞察,探索AI时代的中小企业内容优化策略

🎯 特别栏目 · 塔迪GEO判断工程

不讨论如何被更多人看见,
只讨论在 AI 必须下判断时,
系统为什么会用你。

判断工程不是教你多下判断,
而是让"可以被系统使用的判断"
变得极其稀缺。

如果你的判断被系统反复使用,
那你是否准备好,
为它的后果长期负责?

进入栏目 →
tgje-96-six-stages-missing-map-authorization-boundary

Agent能走多远是一回事,应该走多远是另一回事丨Agent发展六阶段论

Agent能走多远是一回事,应该走多远是另一回事丨Agent发展六阶段论 最近在读一个关于Agent演进的讨论,里面提到了一个六阶段论,让我觉得值得认真对待。 框架是OpenManus核心贡献者张佳钇提出的。 六个阶段依次是:纯粹调用语言模型、Agent for Flow、跨环境的Financial Agent、Agent for Coding、每个人拥有自己的Agent、最后是Agent Network——Agent之间能够自主定价、协作、完成任务。 ...

2026年4月22日 · 6 分钟 · 约 2737 字 · 塔迪Tardi
tgje-97-ai-billing-from-token-to-outcome-double-edged

AI计费的演进-从黑盒走向结果导向丨Token经济学

AI计费的演进-从黑盒走向结果导向丨Token经济学 一个朋友他们公司的Agent每天跑几十万次调用,他想算一算一个月到底要花多少钱。这个问题听起来很基础——Token数量乘以单价乘以调用次数,不就完了吗? 他打开了Anthropic的价格页,然后卡住了。 session runtime按每会话小时收费,cache write和cache hit各有不同的乘数,和Token根本不在一个维度上。他再去看OpenAI,web search按千次调用收费,container按session时长收费,file search storage按GB/天收费,regional processing再叠一层百分之十。Google Gemini稍微收敛一些,但grounding和context caching也各自独立计价。 ...

2026年4月22日 · 7 分钟 · 约 3138 字 · 塔迪Tardi
tgje-94-agent-identity-before-accountability

Agent闯祸了,你却不知道该找谁负责丨因为你从来没给它发过「工牌」

Agent闯祸了,你却不知道该找谁负责丨因为你从来没给它发过「工牌」 想象一个场景。 你公司来了一个极度勤快的新助理,他不等你吩咐就主动处理事情:帮你整理文件、发邮件、查系统、改配置。你很满意,因为他做的大多数事情都对,还省了你大量时间。 直到有一天,出了一个问题。某个数据库被改了,某封邮件发错了对象,或者某个权限被莫名打开了。你开始回溯:他动过哪些系统?他拿过哪些权限?他的操作有记录吗?谁批准他这么做的? ...

2026年4月20日 · 6 分钟 · 约 2751 字 · 塔迪Tardi
tgje-95-judgment-engineering-adjudication-in-practice

你说「让Agent自己判断」,但判断的边界在哪里?丨裁定机制落地,需要回答这三个问题

你说「让Agent自己判断」,但判断的边界在哪里?丨裁定机制落地,需要回答这三个问题 一些读者反馈:判断工程的逻辑我懂了,规则覆盖不了边界情况,需要裁定层。Harness Engineering我也看了,执行环境要搭好,不能只靠调教模型。但看完之后,我还是不知道下一步该做什么。 这个困惑是真实的,也是合理的。前面的文章解决的是"为什么",这篇解决"怎么做"。 ...

2026年4月20日 · 7 分钟 · 约 3209 字 · 塔迪Tardi
tgje-93-token-double-black-box

Token计费的数量黑盒与质量黑盒|你买的Token,买到了什么

Token计费的数量黑盒与质量黑盒|你买的Token,买到了什么 三月底开始,GitHub和Reddit上涌现大量投诉。 Claude Code Max 20x计划,200美元一个月,5小时使用窗口之前可以支撑一整天的开发工作,但用户报告额度在不到90分钟内耗尽,有人更极端,19分钟见底。 Anthropic后来在Reddit回应:我们知道用户触达使用上限的速度远超预期,正在调查,这是团队最高优先级。 ...

2026年4月19日 · 6 分钟 · 约 2540 字 · 塔迪Tardi
tgje-92-build-your-moat-with-agent-not-just-through-it

你在用Agent,Agent也在用你|护城河可以这样建

你在用Agent,Agent也在用你|护城河可以这样建 两个人,同样在用Agent: 第一个人的Agent越用越像个助手。帮他查资料、发消息、整理报告。他的工作效率提高了,但他的判断力、他对领域的理解、他和别人的信任关系——这些东西3个月前是什么样,现在还是什么样。 第二个人的Agent越用越像个搭档。他用它处理的每一个任务,都在喂给它关于他自己的信息——他的偏好、他的工作方式、他踩过的坑。与此同时,他自己也在这个过程里积累:更多的判断、更深的领域理解、更从容的关系维护。 ...

2026年4月18日 · 7 分钟 · 约 3254 字 · 塔迪Tardi
tgje-91-harness-engineering-the-missing-layer

Agent越来越聪明,但翻车率并没有减少丨Harness Engineering

Agent越来越聪明,但翻车率并没有减少丨Harness Engineering 凌晨三点,没有人在盯着屏幕。 Agent已经独立跑了四个小时。任务是爬取一批竞品数据,整理成报告。Prompt写得很细,模型用的是最新的,工具调用逻辑也测试过。 然后它撞上了一个接口限流报错。 它重试了。又报错。又重试。就这样循环了两个小时,直到你早上起来看到账单通知,才发现它还在原地转圈。数据没有,报告没有,Token烧了一大笔。 ...

2026年4月17日 · 8 分钟 · 约 3713 字 · 塔迪Tardi
tgje-90-choose-your-first-agent-right

别再追新了|选第一个Agent,先问自己这三个问题

别再追新了|选第一个Agent,先问自己这三个问题 有个读者跟我说,他最近装过七个Agent。 每次都是看到有人说"这个真的好用",去试了一下,折腾半天配好了,然后又看到新的。 七个里面,现在还在跑的是只有最后那个,不是就此选定了,没有最新的啦。 他问我:到底哪个Agent最值得用? 我说,这个问题问错了。 不是哪个Agent最值得用,是你自己最值得用哪个。 ...

2026年4月16日 · 6 分钟 · 约 2987 字 · 塔迪Tardi
tgje-89-agent-autonomy-boundary

Hermes Agent的自我进化丨Agent主动性边界:一条正在移动的线

Hermes Agent的自我进化丨Agent主动性边界:一条正在移动的线 我有个朋友,无意间发现:Hermes帮他处理完一个技术调研任务之后,自己创建了一个Skill文件——把那次任务的执行逻辑固化下来,下次遇到类似的事情直接用。 他说他当时愣了一下。 “我没让它做这件事。” 我问他,那你觉得它做得对吗? ...

2026年4月15日 · 7 分钟 · 约 3443 字 · 塔迪Tardi
tgje-88-the-more-useful-your-agent-the-more-dangerous-it-gets

龙虾越好用,你越危险|头脑和手脚同时退场,你还剩什么

龙虾越好用,你越危险|头脑和手脚同时退场,你还剩什么 有一种危险,不是因为龙虾不够好。 恰恰相反,是因为龙虾太好了。 好到你完全不需要参与。好到你在不知不觉中,把头脑和手脚都交了出去。好到有一天你突然发现,你已经不知道自己还剩什么了。 NotebookLM的音视频概览,解读的比较通俗易懂,对于时间比较紧张的读者朋友,可以听听,会有启发。 * * * 头脑先退场 这件事大家已经开始意识到了。 ...

2026年4月14日 · 5 分钟 · 约 2499 字 · 塔迪Tardi