Tag archives for 机器学习

开源软件

可视化机器学习开源数据集工具 Facets

Facets是Google开源的一款可视化机器学习开源数据集工具, 包含两个部分 —— Facets Overview 和 Facets Dive ,允许用户以不同的粒度查看其数据的整体图像。Facets Overview 可用于可视化数据的每一个特征,Facets Dive 用来探索个别的数据观察集。 Facets Overview 可展示和比较数据集特征值的分布情况,例如训练集和测试集。阻碍机器学习的常见数据问题被高亮,比如出乎意料的特征值、具有高比例遗失值的特征、带有不平衡分布的特征,数据集之间的特征分布偏差…
继续阅读
开源软件

中科院机器简单学习开源系统Easy ML

Easy Machine Learning 简单机器学习系统是中科院基于大数据分析平台的开源的通用数据流系统, 集成了数据处理、模型训练、性能评估、结果复用、任务克隆、ETL 等多种功能。 优势: 降低定义和执行机器学习任务的障碍 ; 共享和重用算法的实现,作业 DAG(Directed Acyclic Graph有向非循环图) 和实验结果 ; 将独立算法和分布式算法无缝集成在一个任务中。 系统包含三大组件: 分布式的机器学习库 基于 GUI 的机器学习开发环境系统 执行任务的云服务.    
继续阅读
开源软件

腾讯的开源机器学习平台Angel

Angel是由腾讯和北京大学联合开发的开源分布式机器学习平台, 基于参数服务器(Parameter Server)理念,围绕模型, 将高维度的大模型合理切分到多个参数服务器节点,并通过高效的模型更新接口和运算函数,以及灵活的同步协议,实现各种高效的机器学习算法。 Angel基于Java和Scala开发,基于PS Service,支持Spark on Angel,以及其它深度学习框架。经过腾讯内部的海量数据进行了反复的实践和调优,具有广泛的适用性和稳定性,模型维度越高,优势越明显。  
继续阅读