我国人工智能产业如何实现“弯道超车”
◎本报记者 崔 爽
(资料图片)
相比其他国家,中国拥有庞大的实体产业基础,并正加快构建现代化产业体系,对于人工智能技术与行业应用的深度融合有着更庞大、更迫切、更具价值的实际需求,为人工智能技术创新提供了更为广阔的创新实践空间。这也是在大模型时代,国内产业在人工智能领域的机遇所在。
随着国内生成式人工智能的快速发展,相关监管政策正逐步落地,由国家互联网信息办公室等七部门联合发布的《生成式人工智能服务管理暂行办法》(以下简称《办法》)于8月15日正式施行。作为我国首份针对生成式人工智能的规范性监管文件,《办法》以“促进生成式人工智能健康发展和规范应用”为目标,明确国家坚持发展和安全并重、促进创新和依法治理相结合的原则,对生成式人工智能服务实行包容审慎和分类分级监管。
在日益完善的监管链条之下,我国人工智能产业迎来合规发展新阶段,正如各方专家所言,“不发展是最大的不安全”。
运用监管科技激活人工智能市场活力
“ChatGPT的问世引发了新一轮人工智能革命,人类与机器、技术与产业、虚拟与现实之间的关系发生着广泛而深刻的改变,技术创新也给人类社会文明秩序带来了挑战。”近日,在中国社会科学院法学研究所主办的“全球治理话语竞赛下人工智能立法的中国方案”研讨会上,南方财经全媒体集团合规科技研究院院长虞伟表示。
当前全球正在进行智力话语竞赛,掀起新一轮AI监管潮。虞伟介绍,欧洲正谋求AI监管领域的主导权,早早将立法提上日程。2019年欧盟委员会发布《人工智能伦理准则》,提出评价人工智能可信赖的七项标准。2020年欧盟出台《人工智能白皮书》,为人工智能的监管提供多种政策选项。今年6月14日,欧盟议会以压倒性优势的投票结果通过欧盟人工智能法案草案,预计在完成最终谈判后正式审批通过。
南财合规科技研究院首席研究员王俊建议,我国可以在建立基于应用场景的制度、明确政府主导作用并协同社会多方治理、科学应用技术工具等方面借鉴欧洲监管经验。
“我们目前还没有实现对风险全面类型化和场景化的区分,因为风险具有复杂性,单一的治理技术和多元治理场景存在矛盾。接下来可以基于场景把监管做得更精细化,针对不同技术路线、应用模式和责任主体,在不同场景中对不同的风险点进行差异化监管。”王俊表示,同时,可以采取分级治理的模式,给中低风险领域留出试错和发展空间,积极运用一些监管科技,综合选择适配的监管科技模式,激活人工智能市场活力。
新浪集团法务部总经理谷海燕同样认为,希望看到更加有区分度的监管措施。比如欧盟的人工智能法案草案,采用风险区分规制路径,根据风险级别,分为不可接受风险人工智能、高风险人工智能、低风险人工智能,以及最小风险人工智能,并分别设置相关主体的法律义务。
“我们必须关注AI热潮中伴生的风险。”虞伟指出,比如在数据层面,面对生成式人工智能庞大的数据需求,如何建立高质量的语料数据库,如何加强全流程的数据合规管理。在法律层面,生成式人工智能的结果能否构成著作权法所定义的作品仍存争议,进一步的版权归属问题也需要厘清。此外,歧视、偏见、虚假信息传播等风险在大模型大量数据投喂的训练方式下也被放大,如何将道德伦理原则“教”给AI,做到精准纠偏,兼顾公平与效率,这些都需要进一步研究。
构建算力生态支撑人工智能产业发展
数据显示,今年上半年,国内发布的各类大模型数量超过100个。据不完全统计,目前国内已有大约80个参数在10亿规模以上的大模型。《办法》提出,推动生成式人工智能基础设施和公共训练数据资源平台建设。促进算力资源协同共享,提升算力资源利用效能。推动公共数据分类分级有序开放,扩展高质量的公共训练数据资源。鼓励采用安全可信的芯片、软件、工具、算力和数据资源。
算力是数字时代的底座,也是人工智能发展的引擎。据工信部最新消息,截至今年6月底,全国在用数据中心机架总规模超过760万标准机架,算力总规模达到每秒1.97万亿亿次浮点运算(197EFLOPS),算力总规模近五年年均增速近30%,存力总规模超过1080EB。
中国工程院院士刘韵洁表示,我国的算力产业有着广阔的发展前景,因为中国是制造大国,实体经济对于算力有着很大的需求,游戏、AR、VR等消费领域对算力的需求也很大。“有政策支持和技术发展,算力随取随用的前景可以期待。我们未来能够实现像使用水、电一样使用算力。”
但他同时强调,我国的算力网络要想满足大模型的需求,就需要方方面面协同发展。比如,建立通用大模型或行业大模型都需要训练数据,这就需要把行业的数据保护好、利用好、管理好。
把握技术趋势推进行业大模型实践
生成式人工智能的功能远不止提供信息内容服务,其可以作为“技术基座”给金融、医疗、自动驾驶等多个行业领域赋能,未来将成为社会的“技术基础设施”。《办法》明确鼓励生成式人工智能技术在各行业、各领域的创新应用,生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系。
“在以ChatGPT为代表的通用大模型面前,我们的短板比较明显。”刘韵洁在2023中国算力大会直言,“中国的机会在于行业大模型。”
通用大模型一般指在多个领域应用广泛的大型深度学习模型,行业大模型则是专门针对某个特定垂直行业所设计的大型深度学习模型,这些模型通常在特定行业中使用的数据集上进行训练,以提高在该行业中运用的准确度和效率。比较典型的行业大模型,有金融行业的风控模型等。
刘韵洁介绍,基于通用大模型的基础能力,针对行业垂直领域知识和业务场景需求,发展行业大模型已成为技术发展的必然趋势。一方面,行业特定的知识积累和经验可以被应用到模型中,提高模型的质量和准确性;另一方面,行业大模型可以通过学习不断更新迭代,帮助企业更好地理解行业趋势,做出更为准确的商业决策。
目前,国内已逐步建立起涵盖理论方法和软硬件技术的体系化研发能力,一批具有行业影响力的预训练大模型蓬勃发展,形成了紧跟世界前沿的技术群。以华为云盘古大模型为例,据报道,该大模型已经陆续推出矿山、药物分子、电力、气象、海浪等大模型,在各行业落地创新项目超1000个,通过提供先进算法和解决方案,深入大模型的全栈自主创新,加快推动算力国产化。
同时,相比其他国家,中国拥有庞大的实体产业基础,并正加快构建现代化产业体系,对于人工智能技术与行业应用的深度融合有着更庞大、更迫切、更具价值的实际需求,为人工智能技术创新提供了更为广阔的创新实践空间。这也是在大模型时代,国内产业在人工智能领域的机遇所在。