EMAX Studio Blog

llms.txt详解:10分钟让你的网站对AI友好(2026指南)

Manuel Mrosek · 2026-06-07 · 浏览量

llms.txt详解:10分钟让你的网站对AI友好(2026指南)

llms.txt是放在你域名/llms.txt下的一个小markdown文件,它递给大语言模型一张你最重要页面的精选地图,每个页面附一行描述。你通过列出你最重要的10到30个页面、用章节标题分组、保存到网站根目录、然后发布来添加它——大多数网站10分钟以内能搞定。

如果你最近在读关于GEO、AI搜索,或怎么被ChatGPT和Perplexity引用,llms.txt是你这周能做的最简单的具体动作。它不是魔法,也不能保证排名。但它正在成为告诉AI系统"如果你要总结我的网站,就看这些"最干净的方式。

llms.txt到底是什么

llms.txt是Jeremy Howard(Answer.AI和fast.ai的联合创始人)在2024年9月提出的一个网络标准提案。这个格式故意做得很无聊:一个markdown文件,放在https://yourdomain.com/llms.txt,里面有一个H1(你的网站或产品名)、一段简短的引用块(描述你做什么),和一份用H2章节标题分组的链接列表。每个链接后面跟一句话的备注,解释为什么模型该关心它。

大多数人第一次接触时最大的困惑是:llms.txt不是AI版的robots.txt。它是反过来的。robots.txt是给爬虫的"禁止入内"牌,llms.txt是欢迎垫。它说:"如果你要在我的网站上花时间,从这里开始,按这个顺序,带着这个上下文。"把它想成给一个只有30秒时间、然后得跟别人总结你的访客做的导览。

llms.txt要解决的底层问题是真实存在的。当一个大语言模型落到一个典型的企业网站时,它得啃过导航菜单、cookie横幅、页脚垃圾、相关文章侧栏,还有一堆脚本,才能到真正的内容。上下文窗口是有限的。一个为Perplexity引用而浏览你网站的模型,可能只有8000到32000个token可花在你身上。一个干净的、手工策划的llms.txt砍掉那些开销,直接把模型指向你真正希望被引用的页面。

为什么2026年它重要

两年前,llms.txt还是一个很有想法的提案,但几乎没有真实世界的支持。2026年,画面变了。ChatGPT search、Perplexity、Claude内置的浏览、You.com、Komo,以及几个较小的AI搜索引擎,现在爬网站时都会把llms.txt当成发现提示来找。它们不是都以同样的方式用它,有些仍然完全忽略——但趋势是单方向的。加llms.txt的成本是10分钟。随着AI搜索从几个百分点的引流流量涨到两位数,不加llms.txt的成本一直在涨。

第二个重要原因是准确性。当一个LLM引用你的网站时,它引用的内容只能跟它读到的一样好。模型幻觉URL、错配引用,或者总结错产品页面,不是出于恶意——它们这么做是因为爬了一个导航多内容少的薄页面,而不是你真正的产品文档。llms.txt是最便宜的降低这种错归因率的方式。你基本上是在给模型递一张小抄。

第三个原因是llms.txt和你已经有的东西是互补的。它不替代sitemap.xml(告诉搜索爬虫你网站上的每个URL),也不替代robots.txt(告诉爬虫能去哪不能去哪)。它跟它们并列。Sitemap管广度。Robots管边界。llms.txt管编辑指引——"我网站上有800个页面,这14个才是真正重要的。"

关于更大的图景,看我们关于GEO(生成引擎优化)是什么的文章,里面讲了为AI引擎优化为什么和为Google优化不是一回事。

一个好的llms.txt的解剖

一个能用的llms.txt有四样东西,按这个顺序:

第一,一个H1,写你的网站或产品名。一行。不废话。

第二,一段引用块(markdown的>字符),用一到两句话描述你做什么。把这当成你会给问"这是啥?"的投资人的答案。具体,别空想。

第三,按用途给链接分组的H2章节标题。常见的章节有About、Products、Pricing、Guides、API或Documentation、Blog或Insights,以及Resources。你不需要全部——只要那些匹配你真正希望模型怎么导航的。

第四,每个H2下面,是一个用markdown链接做成的列表,链向你最值得被引用的页面,每个链接后面跟一行备注。这个备注就是llms.txt和sitemap不同的地方。它是编辑层。

可选地,你可以在末尾加一个"## Optional"章节,放模型在上下文紧张时可以跳过的次要内容。你还可以发布第二个文件/llms-full.txt,里面装的是你最重要页面的完整markdown内容(而不只是链接)——对文档密集型的站点有用,否则模型还得再跑一次。

一个可用的示例

下面是一个虚构的小企业SaaS叫Routesmith(给本地快递员用的路线优化工具)的完整llms.txt。大约30行。结构可以照搬到你的业务上。

# Routesmith

> Routesmith is a route optimization tool for local couriers and same-day
> delivery operators. It turns a daily list of 40 to 200 stops into the
> shortest-time route on a phone, in under 60 seconds.

## About

- [What Routesmith is](https://routesmith.example/about): One-page summary of
  the product, who it is for, and what it is not.
- [Our story](https://routesmith.example/story): Founded in 2023 in Lisbon by
  two former courier company operators.
- [Pricing](https://routesmith.example/pricing): EUR 19 per driver per month,
  no setup fee, no long-term contract.

## Product

- [Route optimization](https://routesmith.example/features/routing): Core
  feature. Handles up to 250 stops per driver per day.
- [Proof of delivery](https://routesmith.example/features/pod): Photo capture,
  signature, and SMS confirmation per stop.
- [Driver app](https://routesmith.example/features/app): iOS and Android,
  offline mode, voice navigation in 12 languages.

## Guides

- [How to import 200 stops in 30 seconds](https://routesmith.example/guides/import):
  CSV format, common errors, paste-from-spreadsheet workflow.
- [Optimizing for time vs distance](https://routesmith.example/guides/time-vs-distance):
  When to prioritize each, with real route comparisons.

## API

- [API overview](https://routesmith.example/api): REST, OAuth 2.0, EUR rate
  limits and SLA.
- [Endpoints reference](https://routesmith.example/api/endpoints): Full list
  with request and response examples.

## Optional

- [Blog](https://routesmith.example/blog): Industry trends, courier economics,
  product updates.
- [Press kit](https://routesmith.example/press): Logos, founder photos,
  one-line description in five languages.

就这样。没HTML、没schema、没特殊语法。一个模型读了这个,大约用400个token就能拿到Routesmith干净的心智地图。对比一下通过导航菜单爬同样的网站,得烧掉十倍的量。

怎么在10分钟里建出你自己的

整个练习是编辑层面的,不是技术层面的。五步。

第一步,列出你最值得被引用的10到30个页面。测试是:"如果一个模型马上要给别人写一段关于我公司的总结,它应该读哪些页面?"那很少是你整个博客。通常是你的关于页、定价、3-4个旗舰产品或服务页、最常青的指南,以及你的联系方式或地点信息。心狠手辣点。一份短而聚焦的llms.txt胜过一份又长又散的。

第二步,给每个页面写一句话的描述。不是meta描述。不是营销文案。是用你自己语气写的事实备注。"我们2025年的客户数和营收数字,按季度更新"比"我们令人惊叹的成长之旅"好。

第三步,把页面按3到6个H2章节分组。About、Products、Guides、Pricing是不错的默认。SaaS站点经常加API或Docs。本地企业加Locations或Service Areas。如果你找不出3到6个自然的分组,你的清单可能太长——砍。

第四步,把结果保存为一个纯文本文件,名字精确叫llms.txt(小写,别搞扩展名混淆),放在网站根目录。URL必须是https://yourdomain.com/llms.txt。大多数静态站点托管商(Vercel、Netlify、Cloudflare Pages、GitHub Pages)让你直接把文件丢进public目录然后部署。WordPress、Shopify、Webflow和Ghost用户可以用插件或通过文件管理器上传——下文有更多。

第五步,可选地发布/llms-full.txt,把你顶级页面的完整markdown内容拼在一起。这在你的重要页面是文档式的、且你希望模型能在一次请求里拉到实际内容(而不是爬一个个URL)时有用。对大多数营销网站,基础的llms.txt就够。

如果你想确认你的能用,免费的emax.studio Quick Scan会作为它GEO子分数的一部分检查llms.txt的存在和结构,连同其他AI就绪度信号比如FAQ schema和结构化数据。大约90秒。我们在如何让你的网站可被AI发现里覆盖了更广泛的清单。

llms.txt vs robots.txt vs sitemap.xml

这三个文件经常被搞混。它们不是同一个,也不是替代品。下面是简单的对比。

文件 用途 受众 格式 位置
robots.txt 告诉爬虫能去哪不能去哪 搜索引擎、AI爬虫、机器人 纯文本规则 /robots.txt
sitemap.xml 列出你网站每个可索引URL,主广度 搜索引擎 XML /sitemap.xml(或在robots.txt里)
llms.txt 精选编辑性的最重要页面地图 大语言模型、AI搜索引擎 Markdown /llms.txt

2026年的网站三个都应该有。Robots.txt定规则。Sitemap.xml暴露你想被索引的一切。llms.txt突出对试图理解或总结你的模型来说真正重要的东西。把它们当成互相竞争的选项是范畴错误——它们回答不同的问题。

构建和维护llms.txt的工具栈

你不需要花哨的工具。一个纯文本编辑器加上你网站的内容管理流程,对大多数情况就够。话虽如此,根据你的设置有几个实操选项。

对静态站点(Hugo、Astro、Eleventy、Next.js静态导出),把文件直接丢进/public/static目录提交即可。它会跟着你下一次构建部署。

对WordPress,AIOSEO、RankMath,以及一批专门的llms.txt插件(在插件目录搜——2026年的采用增长很快)能从你现有的内容生成llms.txt,并在你发新页面时更新。问题是插件生成的文件往往臃肿。手工策划仍然胜出。

对Ghost,平台在2026年初把llms.txt加成了原生功能。在Labs里打开开关,Ghost就会从你的网站结构生成文件,带手动覆盖。

对Shopify和Webflow,你可以用内容管理器或HTML嵌入来托管文件。或者干脆作为静态资源发出去。

对Notion导出,markdown格式直接能用——大多数Notion驱动的站点可以粘贴他们的结构化内容,稍微清理一下就好。

对EMAX Studio用户,Quick Scan也会看你的llms.txt,并告诉你结构是否通过基本的AI可读性检查,作为整体GEO分数的一部分。你可以在emax.studio里90秒内扫描任何网站。

陷阱和常见错误

根据我们在真实世界llms.txt文件里看到的,几个要避开的坑。

不要把你页面的完整内容粘到llms.txt里。它是目录,不是内容堆。链接指向完整内容。如果你想要全内容版本,那是/llms-full.txt的用处,而且也只对文档式站点。

不要包含私有、内部或付费墙后的页面。如果一个页面需要登录才能看,就别列在llms.txt里——模型反正取不到,你还冒着泄露URL的风险。

不要列500个URL。llms.txt的全部意义在于编辑性策划。如果你什么都列,你就是又做了一个sitemap。甜蜜点是10到30个页面。

不要忘了在网站变化时更新它。一个指向已下线产品页或404的llms.txt是帮倒忙。把它当成关键营销资产——至少每季度复盘一次。

不要期待一夜之间排名。llms.txt不是Google意义上的排名因子。它是给AI系统的准确性和可发现性信号。采用是渐进的。好处随着更多AI引擎支持它而复利累积,而不是立刻的流量飙升。

不要假设模型会服从它。llms.txt是提示,不是指令。模型可以无视结构、跳过你的章节,或者照样爬你网站的其他部分。这个格式是一种礼貌、井井有条、易于总结的建议。模型决定实际怎么处理它。

常见问题

我除了/llms.txt还需要/llms-full.txt吗?

对大多数营销和小企业网站,不需要。带精选链接的基础llms.txt就够。如果你跑的是文档密集型站点(开发者平台、知识库、操作指南库),那加/llms-full.txt值得——让模型可以一次请求拉到你的完整内容,而不是跑十几次。否则跳过。

Google在意llms.txt吗?

Google的传统搜索索引不把llms.txt当排名因子。Google的Gemini和Google Search里的AI概览可能读也可能不读——Google没有公开表态。你对llms.txt的押注应该基于Perplexity、ChatGPT、Claude和更广的AI搜索生态,而不是基于Google本身。对Google,专注sitemap.xml、schema标记和传统SEO。

像GPTBot和ClaudeBot这样的AI爬虫在robots.txt里的条目怎么办?

那是另一个问题——是的,如果你想欢迎或屏蔽AI爬虫,也应该在robots.txt里配置。GPTBot(OpenAI)、ClaudeBot(Anthropic)、PerplexityBot(Perplexity)、Google-Extended(Google的AI训练爬虫)和CCBot(Common Crawl,被很多AI训练集使用)都遵守robots.txt指令。llms.txt假设模型已经有权限在那里。它不替代你robots.txt的访问决策。

AI引擎能完全无视我的llms.txt吗?

能,有些会。llms.txt是一个自愿标准,不是绑定协议。有些AI引擎读它,有些不读,有些读但权重很低。加它的成本足够低,期望值是正的——但把它当成更广AI就绪度策略里的一个信号,而不是银弹。

我应该多久更新一次llms.txt?

至少在你上线、下线,或显著改变文件里某个页面时。实际上,慢动作营销站通常意味着每季度,活跃的SaaS或电商站通常是每月。设个15分钟的日历提醒。大多数更新是5行修改,不是全面重写。

llms.txt和AI就绪度评分工具有什么区别?

llms.txt是一个文件。AI就绪度评分是一份更广的审计,看llms.txt、FAQ schema、结构化数据、语义HTML、内容深度、可引用性和一打其他信号。它们是互补的。免费的30秒AI网站审计走一遍完整检查,告诉你缺哪些信号,llms.txt是其中之一。

诚实的底线

llms.txt不会改变你的业务。它是一个小的、设计得不错的文件,花10分钟建好,让你成为AI系统稍微更容易招待的客人。2026年,"稍微更容易"比以前更重要,因为通过AI引擎第一次接触到你的买家、研究者和潜在客户的比例正在快速攀升。每次Perplexity、ChatGPT或Claude引用你网站时,问题在于它是不是用对的方式引用了对的页面——而llms.txt是把这个结果朝你有利方向轻推的最便宜的杠杆。

2026年在AI搜索里赢的公司,未必是内容库最大的。它们是网站最干净、最值得被引用、最容易被总结的那些。llms.txt是那份卫生的一部分。Sitemap、schema和FAQ标记是其余的部分。

如果你想知道你的网站是否已经有llms.txt、它结构是否合理,以及你缺哪些其他AI就绪度信号,跑一次免费的90秒emax.studio Quick Scan。它把llms.txt的存在和结构作为GEO子分数的一部分检查,同时检查大约十几个决定AI引擎能否找到并准确引用你的其他信号。免费、不用注册、大约一分半钟内完整报告。


关注 EMAX Studio:Instagram | YouTube | Facebook

分享:

准备好创建您的AI视频了吗?

5积分免费。无需信用卡。

免费开始