据VentureBeat报道,越来越多的尖端资源正在开发者之间“流通”,现在,产品的“山寨版”或许在几小时内就上线了。虽然软件专利权对产品的保护作用有限,但是基于此的“战争”却正如火如荼地开展着。现在,不包含数据的软件已经成为了新的商品类型。
这样的“战火”愈发凸显了人工智能和数据的价值。如果没有数据,人工智能技术将无法落地;如果公司希望向用户证明人工智能产品的价值和前景,他们必须借助大量的数据来训练算法的最基本性能,并向客户展示。新客户会带来新的数据,从而使算法性能得到进一步优化并吸引更多的客户——形成良性循环,也会使行业竞争变得更为激烈。
正如上段所说,可用数据的不断输入是维持这种反馈循环的根本。因此,数据权现在已经成为新的知识产权。对于初创企业来说,这是绝佳的机会和挑战。
“初生”是创业公司的优势
对于那些“云时代”的创业公司来说,当“云”刚刚兴起时,用户并没有放心地把数据交给公司。为了让用户安心(assuage these concerns),一些云平台创业企业甚至放弃了管理用户数据的权利。现在,许多类似的协议依旧存在,并阻碍了创业公司的产品研发——产品智能化的前景渺茫。这些创业企业有苦说不出,他们只能艰难地同既有用户协商数据权,或是努力开拓新渠道。
而在目前大热的人工智能领域,更多的用户愿意授权第三方管理其个人数据。因此,为了在研发过程中有效地捕获相关数据,并对其进行清理、设置标签、查询和分析,以实现自动化的预测功能,智能领域需要极强的数据处理能力。
企业和云存储供应商之间的关系依旧很微妙。许多将公司数据存储到云供应商的企业仍然很谨慎;因为它们担心这些同自己共享了深入数据访问权限的公司,未来有可能变成竞争对手。不过,它们认为创业公司不太可能构成威胁。因此,创业公司相对来说更“有资格”,也更容易获得数据的使用权。
用优质数据开始,“循序渐进”以开启良性循环
在人工智能时代,初创公司们正面临着一个“鸡生蛋”的困境:同早期客户谈判时,公司应当在数据权方面表现得更为强势,提出反馈循环带来的庞大的数据需求,利用自身价值来要求数据权限。
对于产品的应用,初创公司首先可以通过寻找替代数据源来训练学习算法,从而启动良性循环。 以下是一些可以尝试的方法:
第一,对于中小型企业和中端市场客户。由于他们对数据权的态度往往更加开放,尤其在用性价比高的产品交换数据时。另外,同小客户的谈判可以作为案例,贡献更多数据,为以后同大客户谈判作参考。
第二,雇佣专门的工程师来负责算法的训练工作。
第三,找外部数据源,例如来自政府机构的公开数据集,或是从第三方供应商(如Clearbit)处购买的数据,或者挖掘相关网站和社交媒体。
第四,提供旗舰产品的免费增值版本以获取用户参与度的数据。
第五,为了捕捉数据,以成本价出售优质产品。例如,所采取的策略即通过建立庞大的数据库来训练自动驾驶汽车。
的确,许多外部数据源中的数据足以将学习算法训练到足够高的性能水平,以展现价值并吸引企业客户。 但在AI时代,初创企业必须建立专有的数据管道,以便于从客户网络中的汇集学习效果中受益。进而,公司可以拉开赛道,甩开新入局者和“山寨”们。
关于数据权的几点策略性思考
虽然创业公司在获得数据权方面更有优势,但谈判实际上并不容易推行:访问客户数据可能带来的风险,和算法的训练需求,二者产生了矛盾。因此,在谈判开始前,初创公司要明确表示他们的兴趣在于从数据和数据流(如用户参与、交互数据、元数据和数据流量信息等)中学习,而而非将客户数据转售给第三方。
数据权谈判固然困难;但是随着创业公司数据库的增长,演示产品的价值和同行客户的网络效应将变得更加明显。在确保客户数据的安全性之后,初创公司将在谈判中获得更多优势。
可能对格局带来怎样的改变?
在云时代,企业竞相发布新功能;但产品的同质性极高,因此,绝对的市场占有率难以实现。不过,用优质数据迈出第一部,并进入数据积累的良性循环,这是企业实现绝佳的机会。这为企业实现“赢家最大”的地位提供了机会。为了实现这一“先锋”角色,创业公司应当以获取数据权为目标,积累客户数据,最终找到新的合作伙伴。
当创业公司积累了样本足够大的数据时,已在场和新的竞争者便都无法缩小割裂。鉴于数据的力量,有史以来技术公司第一次得以建立强悍的保护措施,以对抗遗留下来的传统企业和“山寨”们,而这已远远超出了传统知识产权战略所能提供的。