Question 1

什么是大语言模型中的Token？

Accepted Answer

Token是语言模型处理的文本块。Token可以是单词、单词的一部分，甚至是单个字符。例如，“hamburger”可能被拆分为“ham”、“bur”、“ger”——三个Token。平均而言，英文中一个Token大约是4个字符或0.75个单词。中文中每个汉字通常为1-2个Token。

Question 2

为什么不同模型的Token数不同？

Accepted Answer

不同模型使用不同的分词器（编码方案）。GPT-4o使用o200k_base，词汇表包含20万个Token；GPT-4和GPT-3.5使用cl100k_base，词汇表包含10万个Token。词汇表越大，常见单词越可能作为单个Token，从而产生更低的Token数。

Question 3

Claude的Token计数准确吗？

Accepted Answer

这里显示的Claude Token数是基于cl100k_base分词器的近似估计。虽然Claude使用自己的专有分词器，但计数通常非常接近实际值，适用于成本估算和Prompt优化。

Question 4

如何利用Token数优化Prompt？

Accepted Answer

了解Token数有助于控制模型上下文限制（如GPT-4o的128K、Claude 3.5的200K），估算API成本，并通过删除不必要的文本来优化Prompt。更短的Prompt不仅成本更低，往往还能产生更好的结果。

Token 计数器

功能特点