人工智能初创公司数据断层,或面临行业寒冬
作者:热点 来源:热点 浏览: 【大 中 小】 发布时间:2024-12-12 20:53:14 评论数:
导读:近年来随着机器学习大火,人工人工智能又重新出现在公众面前,初创变成了风口。公司
人工+智能的数据人工智能
近年来随着机器学习大火,人工智能又重新出现在公众面前,断层冬变成了风口。或面媒体经常报道某家的临行AI产品十分智能,堪比人类,业寒人类与人工智能之间的人工对战也越演越烈,一时间AI即将代替人类的初创传闻引发了公众们的担忧。目前来看,公司人工智能创新依赖的数据都是深度学习算法和神经网络。深度神经网络在信息分类方面确实非常有效,断层冬在许多情况下,或面例如语音和面部识别或在MRI和CT扫描中识别癌症,临行它们的表现甚至胜过人类。但这并不意味着目前深度学习和神经网络能够完成人类可以完成的任何任务。
“Andrew"是总部位于纽约的创业公司X.ai开发的一名数字助理,可以扫描电子邮件,为你与同事讨论的会议和约会提供日程安排,创建任务,几乎不需要任何人工协助。它采用了X.ai的高级人工智能功能。但今年五月,《连线》杂志报道Andrew并非完全是人工智能的,它是由位于马尼拉郊区一座高度安全的大厦中的40名菲律宾人提供支持,他们监控人工智能助理的行为,一旦助理遇到无法处理的任务时就立刻接管。
同样的事情也发生在国内。图像识别刚刚兴起时,将图像识别技术引入到内容审核领域成了人工智能商业落地的首选方案,很多公司都选择了使用AI技术来进行内容审核。然而今年4月开始,国家监管部门连续对众多直播短视频社区提出”内容整改“的需求,而相对应的直播短视频社区也纷纷表示将扩大人工审核团队。大家很快发现,尽管智能审核已经相对比较成熟了,但仍然不能完全脱离人工。而人工+机器审核是目前科技公司常用的审核方法。以快手为例,快手拥有数百人的内容审核团队,每条快手短视频、直播的发布都要经过机器和人工等多道审核。
对此,图普科技的运营总监姜泽荣表示,“所有深度学习应用程序都面临着人工智能模型准确度的问题,在训练模型的时候也需要人工的参与,内容审核也不例外。而训练执行特定任务的神经网络所需付出的努力和数据取决于该问题涉及的领域以及所需的准确度。我们认为人工加机器审核是一种比较合适的选择,一方面可以持续优化模型,另一方面也可以根据不同公司的过滤规则来进行调整。”
据了解,图普科技是目前国内已知最大的内容审核服务商之一,识别准确率和召回率均高于99%。姜泽荣介绍到,通常来说客户会根据自身的过滤规则定制服务,而图普科技会将机器审核的结果反馈给客户,最终客户还需要一部分人工审核来调节。
有专家声称这种用人类来弥补人工智能算法缺点的做法是伪人工智能,而也有专家表示只是人工智能的能力被过度吹捧了,目前所谓的人工智能远远不是“强人工智能”,更多的只是一种机器智能,而人工+智能的做法也确实揭示了人工智能初创公司在技术落地时面临的一些更深层次的挑战。
初创公司面临的数据断层
感知问题一直是制约着人工智能发展的重要因素之一,而深度学习确实在某种程度上可以解决感知的问题,但常识推理和理解仍然是深度学习难以攻克的问题。
举例来说,语言是一种感知问题,将单词和句子转换为向量,所以一些公司可以更好地呈现用于文本分类和机器翻译的文本(的确,Google翻译近几年取得了明显的进步),但是这些对于常识推理没有丝毫帮助,这也是聊天机器人总是失败的原因。
像HBO电视剧《硅谷》中的“热狗”APP这样的图像分类APP能够执行的任务非常有限且具体:它能告诉您智能手机的镜头中是否有热狗。如果有足够的热狗图像,该应用程序的人工智能的准确度会更高。即使它偶尔会出错,也不会对任何人造成伤害。
但是其他人工智能应用程序,例如X.ai正在构建的应用程序,试图解决更广泛的问题,这意味着它们需要大量的高质量样本。此外,它们对错误的容忍度要低得多。将黄瓜误认为热狗与在错误的时间安排重要的商务会议完全不是一回事。
不幸的是,并非所有公司都能拥有的高质量的样本数据。
人工智能试图解决的问题越具有一般性,可能发生的边缘情况或异常行为就越多。不可避免地,这意味着需要更多的训练样本来囊括所有可能发生的情况,初创公司通常无法获得大量的训练数据,因此他们有能力建立的模型将是非常小众和脆弱的,通常不符合他们的期望。
只有Facebook、谷歌等大公司才能拥有大量丰富的信息,因为这些公司多年来一直在收集数十亿用户的数据。较小的公司必须支付大笔款项才能获得或创建训练数据,这会拖慢其应用程序的发布。另一种方法是不管怎样立即发布应用程序,利用人类和实时客户数据来实时训练人工智能,并希望最终减少该人工智能应用对人类的依赖。
初创公司会面临新的寒冬吗?
1984年,美国人工智能协会(American Association for Artificial Intelligence,后更名为National Conference of the Association for the Advance of Artificial Intelligence)向商界发出警告,对人工智能的炒作和过度热情最终将令人大失所望。在这之后不久,人们对人工智能的投资和兴趣减退,导致了一个被称为“人工智能寒冬”的时代。
自2010年年初以来,人们对该领域的兴趣和投资再次高涨。因此,一些专家担心,如果人工智能应用程序的表现不佳,并未能达到预期,那将会导致下一个人工智能寒冬的来临。李开复在2018年年初的时候就曾说过,人工智能的泡沫将在年底破灭,一大波人工智能初创公司将面临清算之日。近期《南华早报》报道,光大新经济投资负责人艾渝周六在重庆智博会也表示,AI技术商业化的压力增大,未来如果找不到合适的落地场景,将有百分之九十的人工智能初创企业将会落败出局。艾渝负责管理约300亿元人民币(44亿美元)基金,其投资的初创企业包括美团点评、爱奇艺、商汤科技、蔚来汽车、小鹏汽车等。这些公司中只有不到5%的公司营收达到10亿元,但却以高昂的估值吸引了巨额资金。艾渝预测,未来两年,90%的中国AI初创企业将面临“巨大困难”,而且资金紧缩“今年尤为明显”。
据《华尔街日报》此前的报道,在时空领域提供分析、构建洞察意见与支持预测的超大规模数据集成平台Geospock的首席技术官Steve Marsh认为人工智能现在已经提供了真正的价值,而不是想象中的价值,但是人工智能技术与其他领域的融合可能会导致一些幻灭的感觉。
而就这个观点,图普科技的CEO李明强也表示,一些AI初创公司可能发现他们需要比预期更长的时间来收集足够的数据,才能应用于商业,这也许会造成技术与场景之间的断层。
”我们跑得比较快,但是对于数据量的重要性感受也很深。总之,对于许多没有有利的应用场景或者大量数据的人工智能初创公司来说,可能会面临一个寒冬吧。“李明强总结说道。
人工+智能的数据人工智能
近年来随着机器学习大火,人工智能又重新出现在公众面前,断层冬变成了风口。或面媒体经常报道某家的临行AI产品十分智能,堪比人类,业寒人类与人工智能之间的人工对战也越演越烈,一时间AI即将代替人类的初创传闻引发了公众们的担忧。目前来看,公司人工智能创新依赖的数据都是深度学习算法和神经网络。深度神经网络在信息分类方面确实非常有效,断层冬在许多情况下,或面例如语音和面部识别或在MRI和CT扫描中识别癌症,临行它们的表现甚至胜过人类。但这并不意味着目前深度学习和神经网络能够完成人类可以完成的任何任务。
“Andrew"是总部位于纽约的创业公司X.ai开发的一名数字助理,可以扫描电子邮件,为你与同事讨论的会议和约会提供日程安排,创建任务,几乎不需要任何人工协助。它采用了X.ai的高级人工智能功能。但今年五月,《连线》杂志报道Andrew并非完全是人工智能的,它是由位于马尼拉郊区一座高度安全的大厦中的40名菲律宾人提供支持,他们监控人工智能助理的行为,一旦助理遇到无法处理的任务时就立刻接管。
同样的事情也发生在国内。图像识别刚刚兴起时,将图像识别技术引入到内容审核领域成了人工智能商业落地的首选方案,很多公司都选择了使用AI技术来进行内容审核。然而今年4月开始,国家监管部门连续对众多直播短视频社区提出”内容整改“的需求,而相对应的直播短视频社区也纷纷表示将扩大人工审核团队。大家很快发现,尽管智能审核已经相对比较成熟了,但仍然不能完全脱离人工。而人工+机器审核是目前科技公司常用的审核方法。以快手为例,快手拥有数百人的内容审核团队,每条快手短视频、直播的发布都要经过机器和人工等多道审核。
对此,图普科技的运营总监姜泽荣表示,“所有深度学习应用程序都面临着人工智能模型准确度的问题,在训练模型的时候也需要人工的参与,内容审核也不例外。而训练执行特定任务的神经网络所需付出的努力和数据取决于该问题涉及的领域以及所需的准确度。我们认为人工加机器审核是一种比较合适的选择,一方面可以持续优化模型,另一方面也可以根据不同公司的过滤规则来进行调整。”
据了解,图普科技是目前国内已知最大的内容审核服务商之一,识别准确率和召回率均高于99%。姜泽荣介绍到,通常来说客户会根据自身的过滤规则定制服务,而图普科技会将机器审核的结果反馈给客户,最终客户还需要一部分人工审核来调节。
有专家声称这种用人类来弥补人工智能算法缺点的做法是伪人工智能,而也有专家表示只是人工智能的能力被过度吹捧了,目前所谓的人工智能远远不是“强人工智能”,更多的只是一种机器智能,而人工+智能的做法也确实揭示了人工智能初创公司在技术落地时面临的一些更深层次的挑战。
初创公司面临的数据断层
感知问题一直是制约着人工智能发展的重要因素之一,而深度学习确实在某种程度上可以解决感知的问题,但常识推理和理解仍然是深度学习难以攻克的问题。
举例来说,语言是一种感知问题,将单词和句子转换为向量,所以一些公司可以更好地呈现用于文本分类和机器翻译的文本(的确,Google翻译近几年取得了明显的进步),但是这些对于常识推理没有丝毫帮助,这也是聊天机器人总是失败的原因。
像HBO电视剧《硅谷》中的“热狗”APP这样的图像分类APP能够执行的任务非常有限且具体:它能告诉您智能手机的镜头中是否有热狗。如果有足够的热狗图像,该应用程序的人工智能的准确度会更高。即使它偶尔会出错,也不会对任何人造成伤害。
但是其他人工智能应用程序,例如X.ai正在构建的应用程序,试图解决更广泛的问题,这意味着它们需要大量的高质量样本。此外,它们对错误的容忍度要低得多。将黄瓜误认为热狗与在错误的时间安排重要的商务会议完全不是一回事。
不幸的是,并非所有公司都能拥有的高质量的样本数据。
人工智能试图解决的问题越具有一般性,可能发生的边缘情况或异常行为就越多。不可避免地,这意味着需要更多的训练样本来囊括所有可能发生的情况,初创公司通常无法获得大量的训练数据,因此他们有能力建立的模型将是非常小众和脆弱的,通常不符合他们的期望。
只有Facebook、谷歌等大公司才能拥有大量丰富的信息,因为这些公司多年来一直在收集数十亿用户的数据。较小的公司必须支付大笔款项才能获得或创建训练数据,这会拖慢其应用程序的发布。另一种方法是不管怎样立即发布应用程序,利用人类和实时客户数据来实时训练人工智能,并希望最终减少该人工智能应用对人类的依赖。
初创公司会面临新的寒冬吗?
1984年,美国人工智能协会(American Association for Artificial Intelligence,后更名为National Conference of the Association for the Advance of Artificial Intelligence)向商界发出警告,对人工智能的炒作和过度热情最终将令人大失所望。在这之后不久,人们对人工智能的投资和兴趣减退,导致了一个被称为“人工智能寒冬”的时代。
自2010年年初以来,人们对该领域的兴趣和投资再次高涨。因此,一些专家担心,如果人工智能应用程序的表现不佳,并未能达到预期,那将会导致下一个人工智能寒冬的来临。李开复在2018年年初的时候就曾说过,人工智能的泡沫将在年底破灭,一大波人工智能初创公司将面临清算之日。近期《南华早报》报道,光大新经济投资负责人艾渝周六在重庆智博会也表示,AI技术商业化的压力增大,未来如果找不到合适的落地场景,将有百分之九十的人工智能初创企业将会落败出局。艾渝负责管理约300亿元人民币(44亿美元)基金,其投资的初创企业包括美团点评、爱奇艺、商汤科技、蔚来汽车、小鹏汽车等。这些公司中只有不到5%的公司营收达到10亿元,但却以高昂的估值吸引了巨额资金。艾渝预测,未来两年,90%的中国AI初创企业将面临“巨大困难”,而且资金紧缩“今年尤为明显”。
据《华尔街日报》此前的报道,在时空领域提供分析、构建洞察意见与支持预测的超大规模数据集成平台Geospock的首席技术官Steve Marsh认为人工智能现在已经提供了真正的价值,而不是想象中的价值,但是人工智能技术与其他领域的融合可能会导致一些幻灭的感觉。
而就这个观点,图普科技的CEO李明强也表示,一些AI初创公司可能发现他们需要比预期更长的时间来收集足够的数据,才能应用于商业,这也许会造成技术与场景之间的断层。
”我们跑得比较快,但是对于数据量的重要性感受也很深。总之,对于许多没有有利的应用场景或者大量数据的人工智能初创公司来说,可能会面临一个寒冬吧。“李明强总结说道。