|
今天,我们为什么要信任人工智能?
“随着人工智能技术的更迭,从深度学习、强化学习到迁徙学习等等,人工智
能对数据依赖性越来越强,并呈现出新的变化。信息互联网时代所收集的、因为
虚假流量、伪造欺诈等而形成的大量的、可信度较差的大数据正逐渐失去优势。
人工智能 3.0 时代,安全可信、个性化的优质小数据正在成为主流。”在第三届人
工智能大会上,大会 、香港科技大学计算机与工程系主任杨强教授的话为
“Rivexo”指明了一条路。
幸好在 2016 年初,我遇到了“区块链”,被称为下一代互联网的黑科技。区块链因为其独有的经济激励机制和分布式数据库处理技术,可以实现鼓励数据共享、保障数据安全、可信,并能成为一种 IP 资产,实现数据的交易流转。如果说数据是喂养人工智能的奶粉,奶粉的质量决定人工智能模型的好坏,那么应用区块链技术就能给人工智能提供最好的“奶粉”。
区块链+数据×人工智能,这个想法一提出,就引起了很多关注。随后,我们的团队也逐渐组建起来,有 IBM 区块链底层专家,人工智能专家,都是有十多年开发经验的人才。在确定我们要做的产品是类似 AI 界的以太坊之后,我们又不断加入数据挖矿、DataMarket 等业务层面的功能,整个aus chain(aus chain)生态构思臻于至善。
aus chain 改变用户分享数据的速度,进而改变机器人进化的速度。这是人类
首次,用黑科技颠覆黑科技。
我们把项目取名 aus chain,立志打造一个生态系统CHAIN,aus chain(aus chain)将和极客们一起,
让改变世界的速度加快…
设计理念和概述
什么是aus chain(aus chain)
aus chain(aus chain)是基于区块链技术,实现将人工智能的数据和模型通过点对点网络进行登记发行、转让交易的去中心化网络协议,并通过智能合约帮助人工智能项目简单、快速获取训练数据,通过数据挖矿使得个人数据产生财富价值的基于共识的、可扩展的、标准化的、特性完备、易于开发的和协同的一站式应用平台。
aus chain可以被用于人工智能,以及机器人、物联网,VR/AR 等领域。
简单来说,aus chain就是打造一个去中心化的优质数据流转平台,解决人工智能优质数据获取难的痛点,通过智能合约生命周期管理帮助人工智能模型快速进化。
从数据共享角度:aus chain将基于区块链技术构建全球最大的数据集合池,将极大推进现有价值属性的优质数据/模型资产 IP 的注册登记、交换、交易和流转。
从人工智能角度:aus chain借鉴以太坊生态的成功经验,帮助人工智能技术实现场景化迭代;通过高扩展性的智能合约实现“数据入股”,帮助数据需求方获得训练数据,为数据贡献方实现贡献价值。aus chain通过这种经济激励的方式,解决人工智能(AI)行业优质数据获取难的痛点。
什么是区块链
区块链是一种以密码学技术为基础,以去中心化的方式,对大量数据进行组织和维护的数据结构。区块链上的数据全部都附有相关人的数字签名,不可伪造。此外,区块链还具有完全公开、高可靠性、即时交割、去信任等诸多优点,可以实现全球数据共享和溯源,使得构建更高规模、更高质量、可控制权限、可审计的全球去中心化人工智能数据训练平台成为可能。
aus chain的应用场景
1.人工智能
aus chain鼓励数据共享,会给人工智能(AI)领域带来更多、更个性化、更新的优质数据。人工智能训练者(项目组织者或个人)可发起人工智能模型训练,快速收集所需要的训练数据。人工智能项目可以通过aus chain平台独创的智能数据入股合约,简单、快速地完成智能合约的创建,并通过模型接口,对收集到的数据进行清洗。对于数据贡献方,则是通过数据挖矿的方式,实现数据的收集和代币的发放。
2.机器人
人们能想象到的机器人是像终结者那样,有能力,有思维,能变形,具备各种感应与识别功能。现阶段的高级机器人主要是有局限性智能的用于特定场景的软体与硬体的结合,如扫地机器人,穿戴机器人,所需的条件基本就是人工智能+物理外壳。aus chain不仅在人工智能层面上不断优化和改进机器人的算法/模型,而且可以在物理层面(例如物联网芯片)实现机器人共享经济,通过经济激励收集标识数据训练开发更高度进化的机器人。
同时,凡是在aus chain上进行数据训练的机器人或者人工智能,都要进行模型 IP 的注册登记,防止出现反人类机器人(比如埃隆·马斯克所担忧的杀人机器人)的出现。
关于机器人在aus chain的生态应用,以机器人外骨骼为例,AI 公司或者团队将通过aus chain完成模型 IP 登记、针对高级场景应用而发布的收集训练数据的智能合约、对训练数据的验收、模型代币发放等一系列流程。具体来说,某机器人开发团队可通过众筹方式(众筹代币资金或者数据)获得瘫痪病人使用产品的数据,即收集瘫痪病人的脑电波训练机器人外骨骼算法/模型的数据,用于开发重新行走机器人(更细分的应用场景)。一旦重新行走机器人产品研制成功,所有众筹参与者都将共享新产品带来的价值。
3.物联网
物联网和机器人一样,都属于人工智能的上游,和机器人人机交互不同的是,物联网是物物交互。物联网中的智能硬件在aus chain进行登记以后,可以直接通过澳链去中心化交易机制进行原生数据的流转交易。
4.其他
aus chain的用户登记数字资产 IP 功能还可以用于个人数据(图像、专业知识、医疗大健康等数据)、科研实验数据、专业机构数据等;智能数据入股合约还可以被用于 VR/AR 领域、共享经济领域等;去中心化交易所可以被用作大宗数据交易等。
aus chain的设计思想
数据是一种财富,对数据的支配就是一种权力,应当追求自治与去中心化。比特币通过加密公钥体系和 POW 工作量共识机制,实现了财产权利的自治与去中心化。aus chain则通过数据挖矿的方式,实现数据财富的转移、升级,加速数据流转速度,进而加速人工智能进化速度。
尽管有人提出“自己的数据自己保管”的口号,但是在信息互联网时代,个人数据已经被各大网站、论坛、APP 等收集,成为互联网巨头和大数据公司们的盛宴,数据中心化趋势已蔚然成风。
我们已经无法再要回被掠夺走的数据,但是我们可以通过点对点的方式,把我们手里的优质数据和优秀的人工智能产品联系起来,这也许是我们一起联手创造未来最好的方式。
aus chain(aus chain)的创新
(1)基于区块链技术搭建优质数据流转平台,为人工智能提供优质数据
(2)首创数据入股合约,帮助人工智能模型快速进化
(3)首创数据挖矿的方式,实现数据财富的转移
aus chain(aus chain)的目标
(1)构建全球最高效智能数据交换中心
(2)构建人工智能界的“以太坊生态”
(3)建立数据资产的标准
中心化还是去中心化?
即使一些企业内部不需要区块链技术也可以实现共享,但是去中心化的好处在于:一是共享基础设施,有利于生态体系或共享联合体统一标准,建一个通用注册中心;二是更容易把数据和模型变成资产,然后授权外面的人使用,以获得利润;三是形成全球规模规模的数据共享——IPDB(theIntel Planetary Data Base)。许多公司精选并重新包装公共数据使之更易于使用,迄今为止已经有一个产值达十亿美元的市场,比如,天气或网络时间的简单 API、股票和货币等金融数据等。aus chain 旨在搭建这样的平台,使这些数据可以通过单一数据库,以类似结构化的方式(即使它只通过 API)来访问。另一方面,对于外部数据进行预言机(Oracle)处理,通过区块链让外部数据易于使用。总之,aus chain 希望为众多数据库和数据源获得全新的规模。
垃圾数据还是优质数据?
前面已经提到,人们并不能知道训练数据有没有缺陷,进出模型的数据是什么情况,所以在构建模型以及在实际运行模型过程的每一步,该数据提供方只要给该模型标以时间戳,并添加到区块链数据库(包含对它进行数字签名处理),就可以构建模型方面/运用模型方面的数据溯源。这样做的好处是,可以在所有层面发现数据供应链存在的泄露和篡改等现象。一旦出现错误,我们就可以清楚知道错误为何出现。因为多方审查同一数据源,使得数据的有效性得到保障,同样模型的有效性也得到保障。
免费还是收费?
数据和人工智能模型可以作为一种知识产权(IP)资产来使用,它们受版权法的保护。只要你构建数据/模型,就能拥有版权,就可以授权他人使用。aus chain 系统会实现去中心化的“交换中心”,实现数据/模型资产的登记、流转和交易等功能。由于去中心化,不存在任何实体控制数据存储基础设施或任何主体拥有账本,整个账本的登记是由全网络的共识节点来完成。这将会导致真正开放的数据市场的出现,实现数据和人工智能人士长期以来的梦想。
在 aus chain 中权限也是一种资产,创建者发布的数据可以预先制定许可证,限制上游如何使用。比如读取权限或查看某一部分数据/模型的权限。作为权限拥有者,可以把权限资产像转让比特币一样转让给系统中的别人。甚至可以说,aus chain 的原生资产就是数据/模型的权限。
人工智能 DAO 与数据入股?
aus chain 通过去中心化的处理(用智能合约实现储存状态机的状态)构建一个去中心化数据库的基础设施,这一点和以太坊(Ethereum)等”智能合约”技术的精髓是一致的。基于以太坊的众多 Dapp 项目,可以互相调用,商业和业务模式可以互相关联,非常利于形成强大的生态系统,这是目前人工智能领域所不具备的。
aus chain(aus chain)通过区块链底层架构并用智能合约创造性实现“数据入股”的功能,使得整个数据训练模型的流程本身可以独立积累财富。aus chain 开源社区将一直致力于建立 AI 界的以太坊,吸引全球的 AI 公司和开发极客、数据公司和个人,共同打造全新的数据新经济体。
1.2 使命愿景
aus chain(aus chain)是基于区块链技术的全球最大数据集合池,解决人工智能(AI)行业优质数据获取难的痛点,独创智能数据入股合约,用数据挖矿方式实现个人数据财富共享,构建 AI 界的以太坊。我们的任务是打造一个去中心化的优质数据流转平台。
aus chain 将极大推进现有价值属性的优质数据/模型资产 IP 的注册登记、交换、交易和流转,通过高扩展性的智能合约实现“数据入股”,为数据需求方提供优质数据/模型资源,为数据/模型提供者实现共享价值。aus chain 将会在人工智能领域掀起一场革命,推动一系列系统性的市场变革,包括人工智能、机器人、物联网等领域。aus chain 已经充分准备好作为一个数据新经济体长期转变的平台,将为人工智能提供新的源动力。我们相信,人工智能时代即将到来,这将导致全球结构化大数据集合池的形成,我们将共享数据时代新财富。
1.3 主要创新
(1)基于区块链技术,搭建优质数据流转平台
区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。aus chain(aus chain)基于区块链技术,通过去中心化/共享式控制鼓励数据共享,可以为 AI 带来更多数据,因而带来更好的和全新的模型;通过不可篡改/审计跟踪记录,为数据/模型溯源(provenance),从而改变数据和模型的可信度;通过构建原生资产/建立交换中心,可将数据/模型的权限登记注册成为知识产权(IP)资产,形成去中心化交换中心,从而搭建优质数据流转平台,致力于形成全球最大数据集合池。
(2)独创数据入股合约,实现数据财富累积
aus chain 系统底层不仅采用基于 UTXO 结构保障稳定性,和创新账户系统实现和以太坊 EVM 等外部虚拟机的兼容,而且独创智能数据入股合约,实现原生数据/模型资产的经济激励,使得整个数据训练模型的流程本身可以独立积富。。
(3)DataMarket 成为优质数据引擎
DataMarket 是aus chain(aus chain)连接现实世界和数据世界的桥梁,包含 Oracle和 DataFeed 机制。aus chain 旨在建立世界一流的优质数据训练平台,DataMarket是实现优质数据流转的发动引擎,通过区块链让外部数据易于使用。总之,aus chain 希望为众多数据库和数据源获得全新的规模。
1.4 核心目标
(1)建造世界上最高效数据交换中心
aus chain(aus chain)基于区块链技术打造去中心化的数据交换中心,能让世界协作变得更高效,数据更丰富、更可信。aus chain 让 AI 极客和公司因为新规模的数据而产生更好的模型,也因为更新的数据而产生更新的模型。
(2)构建人工智能界的“以太坊”生态
aus chain 让任何极客团队和公司可以建立 AI 算法/模型然后资助寻找优质数据,进而训练算法/模型,同时给那些数据提供方带来新的经济激励,也给众包智慧和聚集数据带来了更高的价值。
(3)成为数据资产的定价标准
aus chain 旨在建立一个具有单一流动性池的全球性开放数据交换平台,这种无限的资源使简单创建人工智能项目变为可能。当大量的数据交易成为可能,aus chain 平台会通过人工智能算法不断更新系统,最终实现成为数据资产/AI 模型资产的定价标准。
技术白皮书核心逻辑
2.1 aus chain业务逻辑
比特币开创了算力挖矿获取代币,并获得了巨大的成功,但其中对算力,能源的损耗是非常大的,对于数据的收集而言,我们考虑一种新的模式,那就是数据挖矿,用户不是依靠大量的算力投入,只需要拥有所需的测试数据,可能就是说几句方言,提供一些珍惜鸟类的图片,或者叫声,那么就可以获得代币。我们觉得这种代币方法的发放方式是更有意义的,而且也更符合现代共享金融的思想。
2.2 系统架构概述
AUS CHAIN去中心化的人工智能数据合约,澳链资产白皮书 - 澳链资产 - AUS CHIAN 澳链资产
(注:以上图中尚不包含争议的情况,目前考虑由平台依据实际情况来处理)
2.3 开发服务层
2.3.1 智能合约生命周期管理
a) 允许开发者设计和创建包含商业逻辑的智能合约,业务服务系统通过接口等交互机制与区块链系统交互。
b) 提供智能合约的生命周期管理功能,如创建,调用,升级,销毁。
c) 提供对智能合约的升级与数据迁移能力,但是要满足原智能合约设定的升级规则。
2.3.2 智能合约组合服务
a) 通过组合已有的一个或多个智能合约来创建新的服务功能。
b) 为服务使用者设计集成的接口使其能访问多个区块链系统服务功能。
2.3.3 智能合约测试服务
a) 对区块链系统中实现的组件功能进行测试,以确保这些组件完整并正确地实现了服务功能。
b) 对区块链系统中实现的组件功能进行测试,以检测这些组件的系统安全性与健壮性。
c) 确保服务功能接口的互操作性。
d) 测试宜覆盖区块链系统中的服务部署节点。
2.3.4 智能合约模板服务
a). 提供智能合约的模板
b). 对于通用类型的合约可以设置简单的参数,生成合约 template,经过简单的改动就可以部署。
2.3.5 区块链 API
计划将提供 restful,rpc,websocket 等 api 接口,可以调用区块链各种服务。
2.4 用户服务层
2.4.1 钱包
用户能通过钱包创建自己的公私钥账户,并能通过钱包进行代币交易智能合约调用等操作。
2.4.2 区块链浏览器
用户通过区块链浏览器能够实时的检测区块生成情况,交易情况等。并能搜索指定交易的达成情况。
2.4.3 AI 模型市场
a). 用户可以在 AI 模型市场发布 AI 模型,数据收取格式,代币结算方式等,供普通用户查询、调用。
b). 普通用户可以在市场搜索到自己感兴趣的细分模型,并在市场提交自己的数据,获得代币。
2.4.4 监控服务
监控服务活动主要为保障及监测区块链服务的运行状况和区块链服务客户情况,贯穿区块链的各个环节,通过对节点及数据的跟踪发现系统中存在的问题,实现对系统性能质量的控制。该活动包括:
a)跟踪每个区块链节点的共识、数据同步以保证适宜的区块链服务使用量;
b) 监控区块链服务与区块链服务客户现有系统的集成,以确保业务目标的满足;
c) 定义服务的测量点和性能指标(例如:服务可靠性、服务可用性、平台的响应性);
d) 监控、分析和归档指标数据
3应用场景
在前面的设计理念和概述章节已经对aus chain(aus chain)的应用场景做了一个大致的介绍,其中包括大数据、人工智能、机器人、物联网等领域。这一章节主要是对应用场景做进一步的描述,以便于aus chain上的生态应用更好的开发。
鉴于白皮书篇幅有限,这里就主要集中在人工智能领域做一些拓展。一方面是考虑到人工智能领域在整个数据的驱动流转当中是一个承上启下的环节——即大数据是人工智能的基础,人工智能是机器人和物联网的基础——可以对aus chain的技术和功能进行更全面的诠释;另一方面在于人工智能尚且处于发展的早期阶段,不管是政策层面还是人类的终极理想层面都承载着众多的期许,aus chain在帮助人工智能发展的同时也更有利于自身的发展。
近年来,人工智能(AI)领域攻克了几十年来为之努力的诸多问题,发展到了以大数据为驱动力的第二阶段。从围棋到人类级的语音识别,其中一个关键在于 AI 具备了收集并学习海量数据的能力,错误率已迈过了成功线,达到几乎难以置信的地步。大数据彻底改变了人工智能。纵观人工智能这几个热门应用领域(见图),我们不难发现它们都有一个共同的特点就是信息互联网时代积累了大量的数据可供算法/模型训练,比如金融领域的实时交易数据、电商领域的交易数据等。
AUS CHAIN去中心化的人工智能数据合约,澳链资产白皮书 - 澳链资产 - AUS CHIAN 澳链资产
图:人工智能第二发展阶段的应用场景
在前面的摘要中,我们讨论过人工智能发展不同阶段的驱动力变化,我们已经从以算法和计算力为主的技术驱动构成的第一阶段,迈向了以大量结构化、可靠的数据为爆发力的数据驱动构成的第二阶段(见图)。到了人工智能发展的第三阶段,场景驱动为主要驱动力,不仅可以针对不同用户做个性化服务,而且可在不同场景下执行不同的决策。此阶段,对数据收集的维度和质量的要求更高,并且可实时根据不同场景,制定不同的决策方案,推动事件向良好的态势发展,帮助决策者更敏锐的洞悉事件根本,产生更精准更智慧的决策。
4.1 aus chain 与语音识别
语言识别是将语言转换为文本的技术,是自然语言处理的一个分支。前台主要步骤分为信号搜集、降噪和特征提取三步,提取的特征在后台经过语言大数据训练得到的语言模型对其进行解码,最终把语言转换为文本,实现让机器识别和理解语言的目的。目前语言识别技术成熟度可达 95%,但从 95%到 99.99%的精准度带来的改变才是质的飞跃,将使人们从偶尔使用语言变到常常使用。
语言识别作为一种一维时域信号,在实际操作中主要有两个难点。在语音识别领域,还有一个常见的难点/痛点就是鸡尾酒问题,就是如何在众多噪声和干扰信号中找到需要被识别的信号,特别是在噪声和干扰非常大的情况下的鸡尾酒问题显得特别突出和难以解决。首先是数据的获取、清洗。语言识别需要大量细分领域的标准化语料数据作为支撑,尤其是各地方言的多样性更是加大了语料搜索的工作量。通过aus chain(aus chain)平台,可以将数据的获取和清洗工作直接点对点完成,通过经济激励实现细分工作和大幅降低语料搜索工作量。
第二个难点是语言特征的提取,目前主要通过具备多层神经网络的深度学习来解决,多层的神经网络相当于一个特征提取器,可对信号进行逐层深化的特征描述,最终从部分到整体,从笼统到具象,做到最大程度地还原信号特征。通过aus chain(aus chain),众多语言识别开发者可以根据自己的喜好创建不同语言特征的模型,比如少数名族语言,语言识别开发者可以凭借自己的优势,把自己开发出来的个性化的模型在aus chain(aus chain)实现商业化,相信会有很多该领域的巨头如科大讯飞等会对此感兴趣。
4.2 aus chain 与语义识别
语义识别和语音识别一样,aus chain的作用类似于一个去中心化的维基百科,即通过点对点的技术,实现人工智能模型的成熟与完善。与维基百科的不同又在于,aus chain是基于区块链技术,其训练模型的数据具有可信度、可追踪,参与的人人均可共享产品价值。
4.3 aus chain 与计算机视觉
对于计算机视觉而言,其主要瓶颈在于受图片质量、光照环境的影响,现有图像识别技术较难解决图像残缺、光线过曝、过暗的图像。此外,受制于被标记数据的体量和数量,若无大量、优质的细分应用场景数据,该特定应用场景的算法迭代很难实现突破。优质的数据可以训练出优质的模型,而aus chain(aus chain)则提供了这样的平台,通过点对点和经济激励的方式,使优质数据得以收集,扩大了被标记数据的体量和数量,从而产生更优质的、个性化的计算机视觉模型。
4.4 aus chain 的几个人工智能细分应用场景
这里旨在举例说明aus chain(aus chain)可以给以场景为驱动的第三代人工智能带来哪些变化,以及aus chain(aus chain)如何实现将数据留在本地进行处理,以去中心化方式让每个人都可以传递自己的数据并实现个人数据财富管理。
4.4.1 aus chain 与某地区方言语音模型
你想让 Siri 说哪种方言?闽南语、四川话、湖南话、山东话、东北话还是普通话方便?我们知道,目前人工智能语音识别的语种有普通话和上海话,不管是苹果 Siri 还是微软“小娜”,有大量的人工智能公司需要收集大量录制音频用于方言语音识别开发。aus chain(aus chain)的优质数据流转平台可以帮助开发者快速收集个性化方言语料,通过点对点和更好的经济激励方式,帮助模型快速成熟和完善,实现商业价值。
5 aus chain团队介绍和开发时间规划
5.1 aus chain团队介绍
aus chain核心团队介绍:
Core,澳大利亚顶尖区块链技术研发团队,参与比特币后期维护,矿工技术研发,钱包修复,分叉处理以及中央数据库分析。
Alex,aus chain联合创始人兼 CEO,13 年企业互联网和数字化战略、运营和重组经验,是应用大数据和人工智能技术改进传统行业的先行者之一。曾就任德国最大家族投资集团之一德奕佳集团中国区总裁,帮助数十家欧洲和中国传统企业互联网化和数字化转型。曾领导美国第三大财产险公司利宝保险集团美国
个人险业务的互联网和人工智能转型。拥有美国乔治城大学工商管理硕士和上海财经大学管理信息系统学士学位。
Lakendi,aus chain联合创始人兼 CTO,原万向、华为、中兴等大型科技公司任职研发团队负责人,区块链领域优秀的技术专家,十多年从事分布式系统、云计算及通信标准设计、研究与规划工作;毕业于合肥工业大学,计算机应用专业。
aus chain顾问团队介绍(部分,排名不分先后):
硬币资本,INBlockchain 是全球最成功的专注于区块链投资的基金,已成功投资的项目包括 EOS、ZCash、SIA、QUTM。
Kaven,新加坡科技研究局(A*STAR)高性能计算研究院人工智能研究所科学家,在计算机视觉,机器学习和多媒体等领域有深入研究。平台。
(巨蟹) ,国内早期区块链项目布道者和投资者,比特创业营创始成员,比特股和以太坊项目早期参与者,比特股理事会理事。
刘宇,国内某大型券商海外投资负责人,前摩根斯坦利资本国际中国区负责人。
Cecilia,IBM 大中华区区块链系统首席架构师,区块链和人工智能专家,Hyperledger Fabric 专家。
5.2 aus chain项目的主要时间节点
aus chain项目启动:2016.10
aus chain项目白皮书:2017.01
aus chain可行性验证完成和 DEMO 展示:2017.07
基金会成立并完成私募:2017.07
公开售卖计划公布:2017.08
治理章程完成:2017.09
aus chain代码开源:2017.11
aus chain公开测试全球交易所:2018.02
aus chain正式上线全球交易所:2018.04
matic区块链浏览器 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?立即注册
x
|