AI - Oscar's News

企业智能体的上下文图 →

研究人员提出了上下文图系统，该系统使企业AI智能体能够在工人提问前主动向其呈现相关信息，结合持续的状态监控和评分引擎来按紧迫性和相关性对洞察进行排名。该方法在合同管理、事件响应和销售场景中实现了0.83的Precision@5，并将呈现洞察的平均时间从47分钟减少到30秒以下。

研究人员开发了一个AI工具，整合了经济(GTAP)和生物物理(APSIM)模型，通过自然语言查询分析农业供应链中断。该系统使政策制定者和市场参与者能够评估对脆弱农业系统的跨学科影响。

提出了一个新的对抗性社会认识论框架，用于分析在由人类和大型语言模型组成的系统中，通讯代理如何利用信任。这项工作超越了信息茧房和虚假信息等熟悉的概念，而是考查代理如何战略性地扭曲信息以破坏对搭建的主张的信任。

一项全面调查通过将医学实践（通过米勒金字塔能力水平）与18个模型的计算方法联系起来，研究用于临床推理的大语言模型。研究结果表明，医学专科模型在诊断方面表现出色，而通用模型在决策支持方面领先，但在幻觉和基础方面存在持久挑战。

研究人员提出对齐合理性作为一种监管构造，用于确保医疗保健心理健康支持中安全的大语言模型。该框架在三个层级上组织对齐——明确的价值规范、培训和监督——以结构性地防止依赖、边界侵蚀和其他长期心理伤害。

一个名为生物电子学的新领域被引入，以调查启用人工智能的机器假肢和仿生肢体中的隐私风险。该论文记录了可能利用传感和控制系统的潜在对抗性攻击向量，并概述了释放下一代仿生设备全部潜能的研究方向。

Infinity-Parser2 是一个多模态文档解析模型，在包含500万样本的双语语料库上进行训练，采用多任务强化学习跨越八个解析目标。该系统在olmOCR-Bench上取得了最先进的成果（87.6%），在图表、公式和文档理解方面表现出很强的泛化能力。

VectorizationLLM是一个建立在谷歌开放权重模型基础上的专业LLM，用于协助学生学习包括向量化、傅里叶分析和微分方程在内的计算数学。作为教学辅助工具，它提供详细的解释而不是直接答案，以保护学生的学习效果。

研究人员提出了一种基于图神经网络的方法，用于从前臂肌电信号进行实时手势识别，在消费级CPU上实现了99%的准确度和48毫秒的延迟。该方法能够实现对先进假肢和增强现实应用的无缝控制。

对三种AI方法的比较—LLM基线、RAG和多代理系统—在自动化保险核保决策中表明，多代理系统表现最佳，特别是在复杂的多步骤场景中。这项工作展示了新兴AI架构如何在受规管领域支持透明度和人在环管理。