新闻详情

Unity 发布合成数据集,可大幅削减人工智能训练时间和成本

实时 3D 内容创作和运营渠道 Unity 今天宣告发布

Unity 计算机视觉数据集

。该数据集将有用下降计算机视觉运用的开发本钱,加快为制造业、零售业和安防职业练习人工智能的速度。计算机视觉计划供给商现在可认为其 AI 练习需求购买定制化的数据集,一起确保契合严厉的隐私和监管规范。

由 Unity 引擎组成的传神图画可以描绘自动驾驶场景中或许发生的各种低概率事情,然后改进自动驾驶体系的练习作用

关于人工智能练习来说组成数据十分重要,由于往往实践国际所搜集的实在数据无法满意特定的条件或需求。比方隐私规则约束了实在数据的可用性,或规则了数据只能以何种方法被运用。组成数据的一种常见用处是用于预发布的产品测验,此刻实践数据或许不存在或无法被测验人员获取。此外,机器学习需求很多的数据用于练习算法,这也有赖于组成数据。由于在实践生活中,尤其是在自动驾驶汽车职业,生成可以用于算法练习的数据十分贵重。现在 Unity 现已推出了计算机视觉数据集,未来在获取用于人工智能和机器学习练习的高质量组成数据集上,本钱将不再是妨碍。

Unity 人工智能和机器学习高档副总裁 Danny Lange 博士表明:“经过供给契合隐私规则且照实反映实在国际的组成数据,咱们可以让这些具有开创性的数据集为更多立异者所用。根本上来说,这些数据集能协助企业规划和模仿没有呈现过的场景,乃至可以模仿实在国际的用户添加来不断调整练习数据。因而,跟着客户运用领域的扩展,咱们将能看到更智能的室内环境,比方全自助无人零售店等等。”

Unity 运用“域随机化”(domain randomization)技能来创立各种计算机视觉数据集,以此来进步数据质量并操控实践运用中的误差值。在组成数据的过程中,该技能将对方针物体的方位和朝向进行各种排列组合,还有光照和摄像机视点的改变,以及或许完成的 Unity 环境的很多变量装备等。而且,Unity 的组成数据集还可以防止实在数据获取过程中或许存在的隐私违规或不可控的人工误差。比方有些包括实在的人或地址的图画是直接从互联网上不合法抓取的,或是花费很多人力从实在国际中拍照取得。

各类带标签的组成图画数据

关于实在国际的数据,标示的价格跟着标示类型的杂乱性而添加。Unity 则供给了一个适用于任何标签类型的较低价格,客户无论是为简略仍是杂乱的职业规范都将付出相同的标签价格,如 2D 和 3D 鸿沟框、类细分或实例细分。组成数据集是按等级定价模型收费的,客户所需组成的图画数量越多,每幅图画的价格越低。

Lange 博士弥补道:“组成数据正在彻底改变机器学习模型的练习方法,它弥补了人工搜集和符号实在国际数据的许多不足之处。咱们正在探究全部或许性,协助创作者们获取他们决议计划所需、而且担负的起的数据,推进 Unity 技能在各个领域的运用。这也是为什么咱们推出这些数据集,并极力协助客户满意他们的需求。”

← 返回新闻列表