上证报中国证券网讯(记者宋薇萍)记者5月23日从上海人工智能实验室(上海AI Lab)获悉,上海AI Lab近日升级发布书生·思客推理模型。基于一系列“通专融合”底层技术新进展,书生·思客(InternThinker)的专业推理能力大幅提升,成为首个既具备围棋专业水平股票的交易软件,又能展示透明思维链的大模型。在实验室科研人员的布局和着子中,蕴含数千年智慧的围棋成为了科学探索的“试应手”。
据悉,上海AI Lab致力于以“通专融合”路径实现通用人工智能(AGI),为推动科学发现等重要任务带来下一代先进基础大模型。研究团队创造性地构建了一个“加速训练营”,通过对评价建模,与大模型进行交互并提供反馈,从而使大模型持续进化,获得解决复杂推理任务的能力。通过该方法,书生·思客已实现在奥赛级数学、科学对象理解与推理、算法编程、棋类游戏、智力谜题等多个专业任务同步学习演进,并在多任务混合强化学习过程中出现智能“涌现时刻”。
从大模型发展历程来看,主要分化为专业性和通用泛化性两大路线。上海AI Lab率先提出通专融合技术路线,着力解决大模型高度专业化与通用泛化性相互制约的发展困境。这一路径的关键在于同步提升深度推理与专业泛化能力,使模型不仅在广泛的复杂任务上表现出色,还能在特定领域中达到专业水平。实验室进一步提出通过相互依赖的基础模型层、融合协同层和探索进化层“三层”技术路径,可打造“通用泛化性”“高度专业性”“任务可持续性”三者兼得的通用人工智能。
上海AI Lab表示股票的交易软件,未来将系统推进通专融合技术路线的发展与探索,将通专融合的新能力、新进展持续通过书生·思客对外开放,加速以新一代通专融合基座模型的方式解决具体科学发现中的关键问题,同时牵引打造垂直领域示范应用案例,为科学发现与产业创新提供关键驱动力。