“狂飙”过后大模型该走向何方

自从一年前ChatGPT突然爆火,到不久前文生视频大模型Sora以霸屏之势吸引全球舆论关注,与AI大模型相关的议题越来越多地被大众所讨论。为了抢抓机遇,国内不少科技企业争相上线生成式AI。

有报告显示,截至2023年10月,国内公开的AI大模型数量已经达到238个,仅次于美国。过去5年世界上参数量超过百亿的大模型大约有45个,其中9个出现在中国。

狂热之下不乏担忧,“狂飙突进”的大模型还面临哪些突出问题?有何危害?未来将走向何方?


我国大模型发展势头正猛,很多科技企业有敏锐性,敢于探索和创新,值得肯定。但在一路“狂飙”过后,不难发现其在“野蛮生长”过程中产生的一些乱象。

一味盲目跟风。可以说,质量和数量的矛盾始终伴随着大模型的“井喷式”发展。一些企业一味追逐热点,“能不能用不重要,但首先要拥有”“人工智能时代,没有大模型的科技企业就意味着落伍”,在不具备强大的研发和投资能力的情况下,盲目开发低质量产品,没多久便被用户弃用,落入“昙花一现”的尴尬境地。

研发涉嫌模仿。仍有一些大模型因涉嫌“微调国外底座模型”而备受舆论争议。在这个快速发展但充满不确定性的领域里,一些企业更愿意选择“站在巨人肩膀上”,以降低失败风险。去年,一家公司创办的大模型就曾陷入“套壳”风波。尽管该公司坚决否认抄袭,却承认其使用Meta发布的开源大模型LLaMA架构的事实,称只是在此基础上进行研发。

应用效果欠佳。大模型同质化、缺乏多样性成为饱受诟病的问题。不少大模型采用同样的数据集、训练方法等,输出雷同的问题答案。此外,高质量语料短缺也严重制约着大模型的发展。AI写作、AI设计、AI社交等应用被吹上了天,人工智能看似“无所不能”,然而面对“是谁提出了新三民主义”“最近5年中国的GDP数据是多少”等具体问题时,不少大模型表现欠佳。


评论

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注