随着人工智能技术的快速发展,大型科技公司正逐步淘汰非洲和亚洲地区的低薪数据标注人员,转而聘请具备专业背景的高技能人才,以训练更智能的AI模型。
过去,数据标注工作主要集中在简单任务上,如图像分类或文本标记。然而,随着推理型AI系统(如OpenAI的o3、谷歌Gemini 2.5)的兴起,行业对数据质量的要求显著提高。如今,任务不仅要求更高的准确率,还依赖于对文化、语言及真实场景的深度理解。
为满足复杂模型训练需求,Scale AI、Turing和Toloka已开始招募来自生物学、金融、法律等多个领域的顶尖专家。这些专业人士被用于生成具有上下文意义的高质量训练数据集,推动模型在真实世界中的表现优化。
Toloka首席执行官Olga Megorskaya指出:“长期以来,行业过度关注模型架构和算力,而忽视了数据的核心作用。现在,我们终于意识到,优质数据是实现突破的关键。”
为了吸引高端人才,Turing为专家提供比当前收入高出20%至30%的薪资。这一举措反映出企业在数据环节的投入正在上升。与此同时,资本市场的反应也十分积极:Meta在6月向Scale AI投资150亿美元,使其估值达到290亿美元;Turing在3月完成1.11亿美元融资,估值达22亿美元;Bezos Expeditions领投Toloka 7200万美元融资。
OpenAI与谷歌均强调,未来模型的进化将依赖于经过人工验证的高质量数据。尤其在“思路链”(Chain-of-Thought)等高级功能开发中,人类专家需将复杂问题拆解为可执行步骤,再由AI学习模仿,从而实现超越人类水平的表现。
Jonathan Siddharth表示:“要打造真正先进的系统,必须使用来自真实世界的训练数据,并理解模型在哪些情境下可能失效。”
尽管数据成本仅占整体预算的10%至15%,但其战略地位已不可替代。这标志着人工智能行业正从“算力驱动”转向“数据驱动”的新阶段。
KEY 差异线:加密货币项目用来获得媒体报道的秘密工具