把公钥基础设施称为什么模型 嘿,兄弟!告诉我金融科技中的 A、B、C 和 D 分别是什么?

API

API(应用程序编程接口)。

通常人与程序交互的地方叫UI,包括鼠标键盘,触摸屏以及语音输入等等,程序之间的交互就是API,所谓交互,本质上就是预先定义好的传递数据,触发功能的函数。

云计算和共享经济时代,API是科技服务商向客户提供服务的方式。API在金融科技领域应用十分广泛,当软件实现和应用主体需要调用其他外部软件数据和功能时,可以通过API接口实现数据和功能之间的互联互通。未来金融机构和金融科技提供商也将出现从APP到API的趋势,打造开放的生态圈。

API的作用:对于软件提供商来说,留出API给其他应用调用,形成生态,可以最大化软件的价值,让软件更有生命力,同时别人看不到代码,商业机密不被侵害。对于应用开发者来说,有了开放的API,可以直接调用多家公司提供的功能,做成自己的应用,不用事事亲力亲为,节省精力。

人工智能

人工智能(Artificial Intelligence,AI)是英文缩写,目前人工智能在供应链金融科技中最广泛的应用场景包括:图像识别、文本识别、智能单据审阅与比对、智能客服、机器人流程自动化(RPA)等。

1. OCR

光学字符识别(OCR)是指对图片中的文字信息进行高效的定位识别,并智能地将其识别为可编辑文本。

OCR的概念最早诞生于1929年,第一代OCR技术只能识别印刷文本(指定字体)中的数字、英文字母和部分符号,随着深度学习的兴起,OCR技术突破了原有的技术瓶颈,实现了智能化的快速发展。

OCR的本质是图像识别,其原理包括两项关键技术:文字检测和字符识别,首先提取图像中的特征并检测目标区域,然后对目标区域中的字符进行分割和分类。

在日常生活中,OCR技术用于身份证识别、名片识别、车牌识别、驾驶证识别等;在金融科技领域,OCR技术广泛应用于:身份证识别、合同识别、文档识别(含手写识别)、订单识别、发票识别、报表识别等。此外,OCR技术通常与NLP技术等配合使用,通过合同文本训练专用语言模型,提取合同、发票、订单等贸易背景资料关键核心要素,实现真实贸易背景资料的交叉表现,有效防范虚假贸易背景风险。

OCR工作流程包括图像输入、图像处理(如识别前景背景、去除噪声等)、版面分析(机器识别段落等)、字符切割(优化字符粘连、断笔等造成的干扰)、字符识别等。

2. 自然语言处理

NLP(Natural Language Processing)又叫自然语言处理。每种动物都有自己的语言,机器也一样。人类通过语言进行交流,而机器需要通过数字信息进行交流。自然语言处理(NLP)是机器语言与人类语言之间的桥梁,实现人机沟通的目的。

在人工智能出现之前,机器可以处理结构化数据(比如Excel中的数据),但无法处理文章、图片、音频、视频等非结构化语言。为了分析和利用这些文本信息把公钥基础设施称为什么模型,我们需要利用NLP技术让机器理解这些文本信息并加以利用。

NLP 在机器翻译、语音识别、情感分析、聊天机等场景被广泛应用。目前在金融科技领域,其主要应用场景包括:

文档结构:NLP 通常用于识别文档结构。

智能单据审核对比:通过对单据进行结构化处理,与目标单据、目标文本进行智能化、自动化的审核对比。智能单据审核主要帮助业务人员节省时间,提高工作效率。特别是供应链金融科技领域涉及大量的合同、发票、履约材料、单据、票据、证监会查询登记等,人工审核工作量大,错误率高,通过智能单据审核对比,可以大大提高工作效率。

智能分类:NLP通常支持文本实体抽取、文本分类、关键短语抽取、情感分析、关系抽取、产品评价分析等,提取文本中具有特定含义的实体,例如合同字段的文本信息提取,并按照给定的类别体系对输入的文本进行自动分类。

信息舆情:即倾向分析与观点挖掘,通过对带有情感色彩的主观文本进行分析、处理、总结、推理,实现舆情分析、商机发现与风险预警。

智能客服:智能客服适合用户量大的场景把公钥基础设施称为什么模型,一是价值高,二是AI系统一般初期效果不太好,需要迭代完善,用户量大才能支撑快速迭代,如果一个场景本身用的人不多,智能客服就不太适合,迭代太慢会让人越来越不愿意用。

3.机器人流程自动化

RPA是指机器人流程自动化(Robotic process automated),主要可以替代或协助完成数字化设备中的重复性工作和任务。

RPA 常见的应用场景有:通过预先设定的规则,模拟人工进行复制、粘贴、点击、输入等操作,帮助人类完成大量规则相对固定、重复性高、附加值低的工作。RPA 可以用一句话来概括:一种模拟计算机鼠标键盘操作,可以替代人类进行重复性、规律性的计算机操作的技术。

在金融科技领域,RPA可应用于智能数据抓取、数据统计、分析等,如网银交易的查询、抓取和分析,集团内成员单位报表的数据抓取、统计和分析等。

区块链

区块链技术,简称BT(Blockchain technology),又称分布式账本技术,是一种互联网数据库技术,具有去中心化、公开透明的特点,允许所有人参与数据库记录。

区块链技术在供应链金融科技领域应用十分广泛,目前供应链金融科技领域的主流产品电子债(信)证就是以区块链技术作为底层技术,比较有代表性的产品有:X信、X单、X链等,应用主体包括但不限于:商业银行、核心企业、第三方金融科技平台等。

区块链技术最主要的两个特点就是安全性、可追溯性,它采用了加密技术(非对称加密和哈希函数),以及去中心化(采用了P2P技术)。

1.HASH函数

Hash,原意是“切碎并混合”,哈希函数运算的结果就是哈希值,通常简称为哈希。哈希函数又叫散列函数,本质上就是将数据打散,重新排列。哈希的基本作用是提供数据的摘要或指纹,通常的使用场景是完整性验证。基本上,只要涉及到密码学的地方,或多或少都会用到哈希函数。

比如我们在某个网站上注册,提交用户名和密码,那么用户名会直接保存在网站公司的数据库中,但密码不会直接保存,而是先将密码转换成哈希值,而数据库中保存的其实就是密码的哈希值。因此,即便是公司的后端管理员也无法获取用户的密码。这样,如果公司的数据库泄露,用户的密码依然是安全的。当用户自己登录网站时,输入密码提交给服务器,服务器同样进行哈希运算,由于输入的数据没有发生改变,所以哈希值也不会改变,登录就会成功。

hash的作用是对任意大小的一个数据,经过HASH运算后生成一个固定长度的数据,与数据一一对应。它对应的特点有3个:第一,单向性,给定数据M,很容易计算出hash值X,但是给定X,却不可能计算出M,或者说hash算法应该是单向算法(给定x,可以计算出y,而给定y,无法计算出x)。第二,唯一性,两个不同的数据应该有不同的hash。第三,长度固定,给定一个hash算法,不管输入数据有多大,输出的长度都是固定的。但是仔细想一想,如果hash的长度是固定的,也就是取值范围是有限的,而输入数据的取值范围是无限的,那么总会有两个不同的输入,得到相同的hash。所以,hash函数的安全性一定是相对的概念,如果两个不同的输入,却得到相同的输出,这就叫做碰撞。 对于不同的哈希算法来说,哈希位数越多,其安全等级就越高,或者说其“防碰撞性能”越好。

哈希的单向性和唯一性保证了数据在存储或传输过程中如果受到丝毫损坏,其哈希就会发生变化。哈希函数的主要作用是进行完整性验证,完整性意味着数据没有受到损坏。哈希有很多不同的名字,有时叫摘要,有时叫校验和,有时叫指纹。其实它们的意思都是一样的,就是用哈希来表示数据本身进行比较,根据比较结果判断数据是否保持不变。

简单来说,哈希函数的基本作用就是针对大数据计算出一个固定长度的摘要字符串,也就是所谓的哈希值,哈希值的主要作用是进行完整性验证。

2.非对称加密

非对称加密与对称加密相反,对称加密是指加密和解密共用一个密钥,就像我们经常在间谍电影中看到的,敌我双方争夺一本密码本,也就是对称加密中的对称加密密钥。信息的加密和解密都需要一本密码本(类似字典)。对称加密在信息传输上面临巨大的挑战。

1976年,Diffie和Hellman提出了一种新的加密方案,把原来的密钥拆分成两个,一个用来加密,一个用来解密。加密密钥是公开的,称为公钥。解密密钥是保密的,称为私钥。发送信息时,用公钥加密,读取信息时,用私钥解密。由于加密密钥和解密密钥不一致,所以叫非对称加密。1978年,Riveat、Shamir和Adleman首次提出了非对称加密的实现算法,称为RSA算法。

那么区块链技术是如何将非对称加密和哈希函数结合起来进行传输的呢?这主要应用了非对称加密的数字签名功能(非对称加密算法除了可以进行加密通信,还可以进行数字签名)。一般来说,互联网并不是一个安全的信息传输环境,在这样的环境下,信息传输一方面需要加密通信,另一方面需要数字签名。

如果发送信息的一方用私钥对信息进行哈希处理(即形成一个固定长度的字符串)后再进行加密,就会得到一个数字签名。对方收到这个数字签名后,如果能用发送信息一方的公钥解密这个签名,就能验证两点:第一,这个签名确实是私钥持有者签发的;第二,也能证明信息没有被篡改过,因为签名中也包含了信息的哈希值。

3.P2P网络技术

P2P,即Peer to Peer,通常指对等网络,是一种没有中央服务器、依靠用户群体进行信息交换的互联网系统。与有中央服务器的中央网络系统不同,对等网络的每个用户端既是节点又是服务器。

以前常用的迅雷下载,采用的是P2P(Peer to Peer)方式,每个用户下载数据,同时充当一个服务器,存储数据,供其他用户下载。通过P2P技术,P2P用户和服务器越多,下载速度就越快。

传统的信息组织方式,必然存在信息存储中介的存在,比如我们用微信转账,我们发送给对方的钱并不是像表面上看到的直接被对方收到,而是要先通过他们的中心化服务器进行结算,然后才能转给对方。

这种中心化的服务器掌控着所有用户的数据,管理起来方便,但是它的缺点也很明显:第一,安全性。如果中心服务器受到攻击,将导致整个网络的崩溃;第二,道德风险。中心服务器的拥有者在数据安全上存在一定的道德风险。

在P2P网络中,各个网络节点的功能在逻辑上是完全对等的。整个网络中不存在特殊的节点,也不存在服务器和客户端之分。每个节点在对外提供服务的同时,也在利用其他节点为自己提供类似的服务。每个网络节点都拥有相同的数据发送和接收权限,这意味着每个节点都可以提供整个网络所需的所有服务。也正因为如此,任何一个节点的崩溃都不会对整个网络的稳定性构成威胁。

云计算

云计算是分布式计算的一种,是指通过网络“云”把庞大的数据计算程序分解成无数个小程序,再由多台服务器组成的系统对这些小程序进行处理、分析,得到结果并返回给用户。

一般来说,云计算服务类型分为三类,分别是基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)。

IaaS(基础设施即服务):用户可以在云服务商提供的基础设施上部署和运行任何软件,包括操作系统和应用软件。用户没有权限管理和访问底层基础设施,比如服务器、交换机、硬盘等,但有权限管理操作系统、存储内容,可以安装和管理应用程序,甚至有权限管理网络组件。简单来说,用户使用IaaS时,就有权限管理操作系统以上的所有功能。我们常见的IaaS服务有虚拟机、虚拟网络、存储等。

PaaS(平台即服务):PaaS 为用户提供了使用云服务商支持的编程语言、库、服务和开发工具来创建和开发应用程序并将其部署在相关基础设施上的能力。用户无需管理底层基础设施,包括网络、服务器、操作系统或存储,只需控制部署在基础设施中的操作系统上的应用程序,并配置应用程序所托管环境的可配置参数。常见的 PaaS 服务包括数据库服务、Web 应用程序和容器服务。成熟的 PaaS 服务会简化开发人员,提供完整的 PC 和移动软件开发工具包(SDK),拥有丰富的开发环境(Inteli、Eclipse、VS 等),完全托管的数据库服务,可配置的应用程序构建,支持多语言开发,面向应用程序市场。

SaaS(软件即服务):SaaS 为用户提供了使用云服务提供商在云基础设施上运行的应用程序的能力。应用程序可以通过轻量级的客户端界面(如 Web 浏览器)或程序界面从各种客户端设备访问。用户无需管理或控制底层云基础设施,包括网络、服务器、操作系统、存储,甚至单个应用程序功能,可能只有有限的用户特定的应用程序配置设置。类似的服务包括:各类网盘(Dropbox、百度云盘等)、JIRA、GitLab 等服务。这些应用程序的提供者不仅仅是云服务提供商,还有众多的第三方提供商(ISV:独立软件提供商)。

这里我们用汽车的例子来进一步解释IaaS、PaaS、SaaS的区别。假设你需要出门使用交通工具,我们有四种解决方案:

On-premise(本地部署)方案:开自己的车,需要自己保养车子,这是你的安全工作,还需要给车子上保险,提供燃料(服务器+操作系统/数据库+应用软件)。

IaaS:从租车公司租一辆车,车子的保养、安全检查等都由租车公司承担,你只需要提供燃料(操作系统+应用软件)。

PaaS:除了基础设施(汽车),还为你提供司机。类似出租车,你只需要提供目的地,司机来决定汽车的行驶和运作。(你只需要提供应用软件)。

SaaS:类似轨道交通,一切都由别人掌控。只有少数定制化功能。

大数据

大数据在金融科技领域有很多应用,比如我们所熟知的风险控制、用户画像、波动性分析等等。

大数据的应用一般分为几个步骤:

第一步是收集数据。

第二步是数据处理。把数据标准化,清洗脏数据,不准确的数据,或者做一些脱敏。

第三步是数据降维,如果一张表的每一行是一个用户,那么一张表的列数可以达到50万,这个维度非常大,处理起来效率会降低,需要进行一些数据降维,一些导出变量的操作。

第四步是数据建模。金融里面最重要的两个模型:第一个是营销获客模型,预测人们需要什么样的金融服务,主要是预测客户的需求。第二个是风控模型。

第五步是大数据的应用,不同的行业有不同的应用。

© 版权声明
THE END
喜欢就支持一下吧
点赞61赞赏 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容