(资料图片仅供参考)

ChatGPT语言模型已经诞生9个多月,大模型在产业界和学界的发展进展备受关注。同济大学计算机系副主任何良华教授指出,学界难以出现像ChatGPT这样的大模型,主要原因在于算力和数据问题。学术研究不需要追求短期变现,但需要长期的经费支持。相比之下,产业界可以投入更多的资金和资源,从而更容易推动大模型的研发。

据复旦大学计算机学院教授邱锡鹏表示,大模型更顶尖的研究机构在业界,这是一个不可回避的事实。学校和研究院的差异在于自由的探索。在如今高算力要求的情况下,在学术界和产业界的研究院之间,还是可以发挥学术界的优势。

华为诺亚方舟实验室AI研究员谢恩泽表示,构建高质量的数据集对于大模型一个很重要的补充。模型本身来说,用多大的模型配多大的数据以及用多长时间是很重要的,这些只有在大厂才有机会接触一些资源。

当前国内10亿参数规模以上的大模型已发布79个。清华大学人工智能研究院常务副院长孙茂松教授认为,我国乃至全球发展大模型最终的突破关键,是基础科学的突破。他认为,如果弄清楚了大模型里的规律、ChatGPT背后的机理,就有可能克服现有人工智能大模型的局限性,建立下一代人工智能的理论和模型。


推荐内容