(资料图片)

荷兰内梅亨大学近日发布的一份研究报告指出,Meta和OpenAI等公司在使用“开源”术语时,有可能误导用户,因为部分被标记为“开源”的大语言模型实际上并非开源。报告特别提到了Meta公司的Llama 2模型和OpenAI的GPT/codex模型,指出这些大语言模型的训练代码并未向公众开放。 研究人员表示,当前AI社区中,开源大语言模型的缺乏问题日益突显。他们呼吁公司发布更多的开源LLM,以便研究人员和开发人员可以访问代码并提高这些模型的性能。报告中,OpenAI的ChatGPT模型被认为是最“神秘”的,不符合开源标准;而Meta的Llama 2虽然宣称是“开源”,但实际透明度只是稍微优于ChatGPT模型,在开源排行榜上的程度依然很低。 报告认为,这些公司主要出于保护自己的知识产权和控制大语言模型的使用方式等原因,没有将这些模型开源。这使得研究人员和开发人员在面临开源大语言模型上存在天然的弱势,可能无法研究论文结果、改进现有大语言模型的性能。尤其是Meta,该公司自豪地说,Llama 2可用于研究,但似乎仍将该项目的某些部分锁定在开发人员和研究人员之外。

推荐内容