大数据术语英文翻译(一)_瑞科上海翻译公司

      浏览:
年夜数据术语英文翻译(一)_瑞科上海翻译公司

  一、年夜数据
  英文:big data,mega data
  年夜数据,或称巨量材料,指的是须要新处置惩罚形式才气存在更强的决议计划力、洞察发明力跟流程优化才能的海量、下增长率跟多样化的信息资产。


  两、年夜数据的4V:
  Volume(大批)、Velocity(高速)、Variety(多样)、Value(代价)


  三、以后用于剖析年夜数据的对象次要有开源与商用两个生态圈
  开源年夜数据生态圈:
  1、Hadoop HDFS、HadoopMapReduce HBase、Hive 渐次出生,初期Hadoop生态圈逐步形成。
  2、. Hypertable是另类。它存在于Hadoop生态圈以外,但也曾有一些用户。
  3、NoSQL,membase、MongoDb
  商用年夜数据生态圈:
  1、一体机数据库/数据仓库:IBM PureData(Netezza) OracleExadata SAP Hana等等。
  2、数据仓库:TeradataAsterData EMC GreenPlum HPVertica 等等。
  3、数据集市:QlikView、 Tableau 、 和海内的Yonghong Data Mart 。


  四、Hadoop
  Hadoop是一个由Apache基金会所开辟的分布式系统基础架构。
  用户可以正在没有相识分布式底层细节的环境下,开辟分布式顺序。充分利用集群的威力停止高速运算跟存储。
  Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有下容错性的特色,而且计划用来布置正在昂贵的(low-cost)硬件上;并且它供给下吞吐量(high throughput)去接见应用程序的数据,得当那些有着超大数据散(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的情势接见(streaming access)文件系统中的数据。
  Hadoop的框架最焦点的计划就是:HDFS跟MapReduce。HDFS为海量的数据供给了存储,则MapReduce为海量的数据供给了计较。


  五、Apache基金会
  Apache软件基金会(也就是Apache Software Foundation,简称为ASF),是专门为撑持开源软件名目而办的一个非盈利性组织。正在它所撑持的Apache名目与子项目中,所刊行的软件产品皆遵守Apache许可证(Apache License)。


  六、MapReduce
  MapReduce是一种编程模子,用于大规模数据散(大于1TB)的并行运算。观点”Map(映射)”跟”Reduce(归约)”,跟它们的次要思惟,皆是从函数式编程语言里借来的,另有从矢量编程语言里借来的特性。它极大处所便了编程人员正在不会分布式并行编程的环境下,将本人的程序运行正在分布式系统上。 以后的软件实现是指定一个Map(映射)函数,用来把一组键值对映射成一组新的键值对,指定并发的Reduce(归约)函数,用来保障一切映射的键值对中的每一个同享不异的键组。


  七、BI
  商业智能(BI,Business Intelligence)。
  BI(Business Intelligence)即商务智能,它是一套完全的解决方案,用来将企业中现有的数据停止无效的整合,快捷精确的供给报表并提出决策依据,资助企业做出理智的营业运营决议计划。


  八、CRM
  CRM即客户关系经管,是指企业用CRM技巧去经管与客户之间的关联。正在分歧场所下,CRM能够是一个管理学术语,能够是一个软件系统。平常所指的CRM,指用计算机自动化剖析发卖、市场营销、客户服务和使用等流程的软件系统。它的方针是经由过程进步客户的代价、满意度、赢利性跟忠实度去缩减发卖周期跟发卖本钱、增加收入、探求扩展营业所需的新的市场跟渠道。CRM是取舍跟经管有代价客户及其关联的一种贸易战略,CRM要求以客户为中间的企业文明去撑持无效的市场营销、发卖与效劳流程。


  九、云计较
  云计较(cloud computing)是基于互联网的相关效劳的增长、利用跟托付形式,平常波及经由过程互联网去供给静态易扩展且时常是虚拟化的资源。云是收集、互联网的一种比方说法。过来正在图中常常用云来默示电信网,厥后也用来默示互联网跟底层基础设施的笼统。是以,云计较以至可以让您体验每秒10万亿次的运算才能,拥有这么壮大的计算能力可以模拟核爆炸、猜测气候变化跟市场发展趋势。用户经由过程电脑、笔记本、手机等方法接入数据中心,按本人的需要停止运算。


  十、云计较相关
  分布式计算(Distributed Computing)
  并行计算(Parallel Computing)
  功效计较(Utility Computing)
  收集存储(Network Storage Technologies)
  虚拟化(Virtualization)
  负载平衡(Load Balance)
  热备份冗余(High Available)


  十一:数据仓库
  数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库是为企业一切级别的决策制定进程供给撑持的一切类型数据的策略鸠合。它是单个数据存储,出于剖析性讲述跟决议计划撑持的目标而创立。 为企业供给须要营业智能去指点业务流程改善跟监督工夫、本钱、质量跟节制。


  十二:非关联型数据库
  NoSQL,泛指非关联型的数据库。跟着互联网web2.0网站的鼓起,传统的关系数据库正在对付web2.0网站,特殊是超大规模跟下并发的SNS类型的web2.0杂静态网站曾经显得力所能及,裸露了良多难以克服的问题,而非关联型的数据库则因为其本身的特色失掉了十分疾速的开展。NoSQL数据库的发生就是为了办理大规模数据鸠合多重数据品种带来的应战,特别是年夜数据使用难题。


  十三:结构化数据
  结构化数据(即止数据,存储正在数据库里,可以用二维表布局去逻辑抒发实现的数据)而言,没有便利用数据库二维逻辑表来显示的数据即称为非结构化数据,包罗一切格局的办公文档、文本、图片、尺度通用标识表记标帜语言下的子集XML、HTML、各种报表、图象跟音频/视频信息等等。


  十四:结构化分析方式
  结构化分析方式(Structured Method,结构化方式)是强调开发方法的布局合理性和所开发软件的布局合理性的软件开发方式。布局是指体系内各个构成因素之间的彼此接洽、相互作用的框架。结构化开发方法提出了一组进步软件结构合理性的原则,如分化与笼统、模块独立性、信息隐蔽等。针对软件生计周期各个分歧的阶段,它有结构化分析(SA)跟结构化程序计划(SP)等方式。


  十五:半结构化数据
  跟平凡杂文本比拟,半结构化数据存在必然的结构性,但跟存在严厉实际模子的关系数据库的数据比拟。OEM(Object exchange Model)是一种典范的半结构化数据模型。
  半结构化数据(semi-structured data)
  正在做一个信息系统计划时确定会波及到数据的存储,普通咱们皆会将体系信息保留正在某个指定的关系数据库中。咱们会将数据按营业分类,并计划响应的表,然后将对应的信息保留到响应的表中。好比咱们做一个营业体系,要保留员工根本信息:工号、姓名、性别、出生日期等等;咱们便会树立一个对应的staff表。
  但不是体系中一切信息皆可以如许简略的用一个表中的字段便能对应的。


  十六:非结构化数据
  非结构化数据库是指其字段长度可变,而且每一个字段的纪录又可以由可反复或不成反复的子字段组成的数据库,用它不只可以处置惩罚结构化数据(如数字、符号等信息)并且更得当处置惩罚非结构化数据(全文文本、图像、声响、影视、超媒体等信息)。


  十七:数据库(Database)
  数据库是依照数据结构去组织、存储跟经管数据的堆栈,它发生于距今六十多年前,跟着信息技术跟市场的开展,特殊是二十世纪九十年代当前,数据管理不再仅仅是存储跟经管数据,而转变成用户所须要的各类数据管理的方法。数据库有很多种类型,从最简略的存储有各类数据的表格到可能停止海量数据存储的大型数据库系统皆正在各个方面失掉了普遍的使用。


  十八:数据分析
  英文名:Data Analysis
  数据分析是指用得当的统计分析方式对网络去的大批数据停止剖析,提取有用信息跟造成论断而对数据加以具体研讨跟归纳综合总结的进程。这一进程也是质量管理体系的撑持进程。正在实用中,数据分析可资助人们作出断定,以便采用得当行为。
  Excel作为常用的剖析对象,可以实现根本的剖析事情,正在商业智能范畴Cognos、Style Intelligence、Microstrategy、Brio、BO跟Oracle和海内产物如Yonghong Z-Suite BI套件等。


  十九:数据挖掘
  数据挖掘(英语:Data mining),又译为材料探勘、数据采矿。它是数据库常识发明(英语:Knowledge-Discovery in Databases,简称:KDD)中的一个步调。数据挖掘普通是指从大批的数据中经由过程算法搜刮潜藏于此中信息的进程。数据挖掘平常与计算机科学有关,并经由过程统计、在线剖析处置惩罚、情报检索、机械学习、专家系统(依赖过来的履历轨则)跟模式识别等诸多方式去实现上述方针。


  二十:数据荡涤
  数据荡涤从名字上也看的出就是把“脏”的“洗掉”,指发明并改正数据文件中可辨认的毛病的最初一道顺序,包罗检查数据一致性,处置惩罚有效值跟缺失值等。由于数据仓库中的数据是面向某一主题的数据的鸠合,这些数据从多个营业体系中抽取而去并且包括历史数据,如许便制止不了有的数据是毛病数据、有的数据相互之间有摩擦,这些毛病的或有摩擦的数据明显是咱们没有想要的,称为“脏数据”。咱们要依照必然的划定规矩把“脏数据”“洗掉”,那就是数据荡涤。而数据荡涤的使命是过滤那些没有符合要求的数据,将过滤的成果交给业务主管部分,确认是不是过滤失落仍是由营业单元批改之后再停止抽取。没有符合要求的数据次要是有没有完全的数据、毛病的数据、反复的数据三大类。数据荡涤是与问卷审核分歧,录入后的数据清算普通是由计算机而不是人工实现。


  二十一:可视化
  可视化(Visualization)是利用计算机图形学跟图像处理技巧,将数据转换成图形或图象正在屏幕上显现出来,并停止交互处置惩罚的实际、方式跟技巧。它波及到计算机图形学、图像处理、计算机视觉、计算机辅助计划等多个范畴,成为研讨数据表示、数据处理、决策分析等一系列问题的综合技巧。现阶段正在飞速发展的虚拟现实技巧也是以图形图像的可视化技巧为依靠的。


  二十二:数据可视化
  英文名:Data visualization
  数据可视化技巧的根本思惟是将数据库中每一个数据项作为单个图元元素默示,大批的数据散组成数据图象,同时将数据的各个属性值以多维数据的情势默示,可以从分歧的维度窥察数据,从而对数据停止更深化的窥察跟剖析。
  数据可视化次要致力于借助于图形化手腕,明晰无效天转达与相同信息。可是,那并没有便意味着,数据可视化便必然由于要实现其功用用途而使人觉得枯燥乏味,或许是为了看上去绚丽多彩而显得极度庞大。为了无效天转达思惟观点,美学情势与功用须要齐头并进,经由过程直观天转达要害的方面与特点,从而实现关于相称希罕而又庞大的数据散的深化洞察。然而,计划职员常常并不克不及很好天掌握计划与功用之间的均衡,从而缔造出脆而不坚的数据可视化情势,没法到达其次要目标,也就是转达与相同信息。


  二十三:产物数据管理
  产物数据管理(Product Data Management)是基于分布式收集、主从布局、图形化用户接口跟数据库件经管技巧开展起来的一种软件框架(或数据平台),PDM对并行工程中的职员对象、设备资源、产物数据和数据天生进程停止周全经管。


  二十四:DSP(需求方平台)
  DSP(Demand-Side Platform),就是需求方平台。这一观点起源于网络广告蓬勃的西欧,是随同着互联网跟广告业的飞速发展新鼓起的网络广告范畴。它与Ad Exchange跟RTB一路疾速突起于美国,已正在寰球快捷开展,2011年曾经笼罩到了西欧、亚太和澳洲。正在世界收集展现告白范畴,DSP方兴日盛。DSP传入中国,疾速成为高潮,成为鞭策中国收集展现告白RTB市场快捷开展的能源之一。


  二十五:DMP(数据管理平台)
  DMP(Data-Management Platform)数据管理平台,是把疏散的第一、第三方数据停止整合归入同一的技巧平台,并对这些数据停止标准化跟细分,让用户可以把这些细分成果推向现有的互动营销情况里。
  DMP的焦点元素包罗:
  ·数据整合及标准化才能:采取统一化的方法,将各方数据吸纳整合。
  ·数据细分经管才能:创立出并世无双、有意思的客户细分,停止无效营销举止。
  ·功用健全的数据标签:提供数据标签灵活性,便于营销举止的利用。
  ·自助式的用户界面:基于网页web界面或其他集成计划间接获取数据对象,功用跟几种情势报表跟剖析。
  ·相关渠道情况的毗邻:跟相关渠道的集成,包括网站端、展现告白、电子邮件和搜刮跟视频,让营销者能找到、定位跟供给细分群体相关高度的营销信息。



参考资料

热门标签

更多 >