当前位置: 网站首页 > 手机 > 详情

斯坦福2021(斯坦福2025)

2024-04-11 01:27:00 手机 0

2023人工智能指数报告出炉!这份报告显示,中国人工智能会议论文数量位居全球第一,但被引用次数低于美国。此外,全球发表人工智能论文的前十名机构中,中国占了9个,而且都在追赶麻省理工学院。

今天,斯坦福大学发布了2023 年人工智能指数报告。

斯坦福2021(斯坦福2025)

值得注意的是,斯坦福AI指数报告以“AI论文发表量”为单位列出了全球排名前十的机构。他们九人全部来自中国,而且都赶上了麻省理工学院。

它们是:中国科学院、清华大学、中国科学院大学、上海交通大学、浙江大学、哈尔滨工业大学、北京航空航天大学、电子科技大学、北京大学、和麻省理工学院。

今年的报告分为八个主要部分:研究与开发、技术绩效、人工智能技术伦理、经济、教育、政策与治理、多样性和公众观点。

以下内容摘录了报告的几个要点。

中美论文合作全球居首

2010年至2021年,虽然AI论文跨境合作步伐放缓,但美国和中国之间的AI研究合作数量自2010年以来增加了约4倍,是2010年的2.5倍中英合作总数。次。

然而,2020-2021年,中美合作总数仅增长2.1%,为2010年以来的最小同比增速。

此外,自2010 年以来,人工智能论文总数增加了一倍多。从2010 年的20 万篇文章增加到2021 年的近50 万篇文章(49,601 篇)。

从发表的人工智能论文类型来看,2021年,所有发表的人工智能论文中,60%是期刊文章,17%是会议论文,13%来自存储库。

尽管过去12 年中期刊论文和知识库论文分别增长了3 倍和26.6 倍,但会议论文数量自2019 年以来有所下降。

模式识别、机器学习和计算机视觉仍然是人工智能领域的热门话题。

中国在期刊、会议和知识库论文总数方面仍然领先。

美国在人工智能会议和存储库引用方面仍然领先,但这些领先地位正在慢慢消失。尽管如此,世界上大多数大型语言模型和多模态模型(2022 年为54%)都是由美国机构开发的。

中国霸榜 AI 顶会,但引用量低于美国

在人工智能期刊论文发表方面,中国始终保持领先地位,2021年为39.8%,其次是欧盟和英国(15.1%),然后是美国(10.0%)。

2010年以来,中国人工智能期刊文章被引用比例逐渐上升,而欧盟、英国、美国均出现下降。中国、欧盟、英国、美国占全球总引用量的65.7%。

那么,世界顶级会议上发表的论文情况如何呢?

2021年,中国在全球人工智能顶级会议上发表的论文占比最大,为26.15%,其次是欧盟和英国,占20.29%,美国以17.23%排名第三。

从顶级会议论文被引用情况来看,中国虽然生产力较高,但与美国相比,其被引用率较低。美国顶级会议论文被引用率为23.9%,中国为22.02%。

从侧面可以看出,中国发表论文数量最多,但质量却没有美国高。

美国在AI 论文存储库提交量方面领先世界,占23.48%。中国最低,为11.87%。

中国 9 所机构,AI 论文发表赶超 MIT

2021年,全球发表论文总数前十的机构中,中国占9席。各机构发表的论文总数如下所示。麻省理工学院排名第十,发表论文1745篇。

在计算机视觉(CV)领域,我国十所机构跻身全球前十。它们是:中国科学院、上海交通大学、中国科学院大学、清华大学、浙江大学、北京航空航天大学、武汉大学、北京理工大学、哈尔滨工业大学、天津大学。

在自然语言处理(NLP)领域,情况有所不同。

全球排名前十的机构/公司分别是:中国科学院、卡内基梅隆大学、微软、清华大学、卡内基梅隆大学-澳大利亚、谷歌、北京大学、中国科学院大学、阿里巴巴、亚马逊。

语音识别领域排名如下:

工业界领先学术界

2022年发布的重要人工智能机器学习系统中,语言系统占比最多,有23个,是多模态系统数量的6倍。

就论文产量而言,工业界领先于学术界。

直到2014 年,最重要的模型都是由学者发布的。自此,工业界发生了逆转。到2022年,工业界将诞生32个重要的机器学习模型,而学术界将只有3个。

可以看出,与非营利组织和学术界相比,构建最先进的人工智能系统越来越需要大量的数据、计算机能力和财政资源,而行业参与者当然有更多的财政资源来做到这一点。事情。

2022 年,美国生产的重要机器学习系统数量最多,达到16 个,其次是英国(8 个)和中国(3 个)。

此外,自2002 年以来,美国在创建的重要机器学习系统的总数方面已经超过了英国、欧盟和中国。

看看这些重要人工智能系统背后的研究人员的国家分布,美国的研究人员数量最多,为285人,是英国的两倍多,是中国的近六倍。

LLM 越来越大,算力越贵

大语言和多模态模型(有时称为基础模型)是一种新兴且日益流行的AI 模型类型,经过大量数据训练,适用于各种下游应用。

ChatGPT、DALL-E 2 和MakeA-Video 等大规模语言和多模态模型已经展示了令人印象深刻的能力,并开始在现实世界中广泛部署。

对这些模型作者所属国家的分析表明,这些研究人员大多数来自美国机构(54.2%)。

斯坦福人工智能指数报告还列出了大语言和多模态模型发布的时间表。

大型语言模型变得越来越大、越来越昂贵。

第一个大规模语言模型GPT-2 于2019 年发布,拥有15 亿个参数,训练成本约为5 万美元。 Google PaLM 是2022 年推出的大型语言模型之一,拥有5400 亿个参数,成本高达800 万美元。

从参数和训练成本来看,PalM 比GPT-2 大360 倍,成本高160 倍。

不仅仅是Palm,大语言和多模式模型作为一个整体都变得越来越大、越来越昂贵。

例如,DeepMind 于2022 年5 月推出的大规模语言模型Chinchilla 估计成本为210 万美元,而BLOOM 的训练成本约为230 万美元。

随着时间的推移,GAN 在人脸生成方面取得了进展,最后一张图像是由Diffusion-GAN 生成的,该模型在STL-10 上实现了最先进的SOTA。

去年,随着OpenAI的DALL-E 2、Stability AI的Stable Diffusion、Midjourney、Meta的Make-AScene以及Google的Imagen的发布,文本到图像生成模型逐渐进入公众视野。

下面,输入相同的提示“一只熊猫在温暖的巴黎夜晚弹钢琴”,图像由三个可公开访问的AI 文本到图像系统生成:DALL-E 2、Stable Diffusion 和Midjourney。

在所有最近发布的文本到图像生成模型中,Google 的Imagen 在COCO 基准测试中表现最好。

今年,创建Imagen 的谷歌研究人员还发布了DrawBench,这是一个难度更大的文本到图像基准测试,旨在挑战日益强大的文本到图像模型。

此外,报告还介绍了当前生成式人工智能模型的一些偏差。例如,当DELLE-2被提示CEO时,每个人似乎都摆出双臂交叉的自信姿势。

在《中途旅程》中,当提示生成“影响者”时,它生成了4 张看起来较年长的白人男性的图像。

报告全文内容请参见:

https://aiindex.stanford.edu/wp-content/uploads/2023/04/HAI_AI-Index_Report_2023.pdf

本文来自微信公众号:新智元(ID:AI_era)