英文单词或者汉字,我们在后文解释。 和语言模型的长度一直在增长。截至已经支持多 。这里K代表一千(也就是万如何去优雅又节省地给大语言模型写提示语已成为一门手艺。 截至4年5月的型及其上下文长度限制给大语言模型下指令有点像往早期计算机里输入指令,在键盘发明之前,需要在一条穿孔纸带一点一点把指令喂给计算机。比尔盖茨和保罗
阿兰最早开始合作编程的时候就是这
么操作计算机的。 早期孔纸 德国电子邮件列表 带:行8列,大致能输入8字节的指令。 可以输入节的指令那么问题来了:哪种语言能够用最少表达最多的意思?中文吗?咱们老祖宗留给我们的瑰宝一向言简意赅呀。这是否意味着可以使用中文作为 的指令提示语言? 如果再深入一步,这个世界上还有比中文更“简洁”的语言吗? 语言简洁度排名
从中多研究从不同角度探讨了如何确定世界上 这就是定期去健身房的用武 各种语言的简洁度。在这里我们引用两个研究供大家参考。 翻译同一文本后的长短有人对公共互联网上谷歌隐私政策的不同语言翻译进行了评估。 以下是按字符总数排名的语言示例: .繁体中文:个字符 .简体中文:4个字符 3.日语:5 个字符 4.英语:345 个字符 5.西班牙语:376 个字符 6.法语:47 个字符 7.越南语:43 个字符 .印地语: 个字符 这样可以把各个语种的信息密度量化:繁体和简体中文确实是非
常简洁的语言!么认为 最有效的
语言是什么?这张表展示了对谷歌隐私政策 CZ 领先 片段的不同语言的翻译。 语速和简洁度另一项研究测量了说话的速度,基本假设是“不简洁的语言要更快的说”。 研究发现,说西班牙语和日语的人语速很快,而说汉语和越南语的人语速很慢。 如果以越南语的简洁度为,那语言简洁度有以下排名: .越南语: .中文.英语西班牙语:.63 5.日语:.49 当然,这项研究并不一定准确。因为一种语言的语速快慢也和当地人的生活节奏有关。
结合这个排名和上面的表看,这也可以从侧面解释为什么西班牙语听起来更快。 基于以上结果,是不是说我们只要用中文写大语言模型的指令提示就可以了?根本不是。 的词汇主要是英语 尽管英语形态复杂,但由于以下几个关键因素,英语仍然是大语言模型最青睐的“编程”语言: 词汇优势:像这样的大语言模型主要接受英语文本的训练,具备强大的英语词汇和并能理解到语言中用词的细微差别。 提示效率:英语通常也是效率最高的提示语言。 文化和语义丰富性:英语在许多领域都是一种通用语,提供