基于大数据分布式处理框架的一站式机器学习与预测分析服务平台,提供全流程可视化的特征分析、模型构建评估以及部署应用功能,降低人工智能在企业中的使用成本,帮助企业提高智能应用的构建能力以及效率。
支持所有主流数据库、文件系统、文本格式的数据接入,支持大数据生态系统技术的对接, 如HDFS 、HBase、Hive等。
通过多种数据清洗、转化、降维算法,有效的支持不同机器模型的特征抽取和特征复用,大大降低特征工程的开发成本。
提供基于分布式计算框架编写的大规模机器学习算法库,以及全流程可视化的迭代式模型训练,辅助数据科学家构建高性能的挖掘模型。
支持在线、离线两种模型评估手段,简化模型评估工作。评估结果的可视化展现让评估结果一目了然,训练出的模型更匹配业务问题。
通过云服务REST接口或者现场POJO应用部署,为大数据科学团队与数据工程团队建立顺畅的桥梁,确保智能应用的敏捷开发。
基于分布式数据处理方式,为大数据的处理效率提供强有力的支撑,实现数据从产生到计算结果的生成秒级延时,提供准实时的分析、挖掘能力。
支持对海量数据的数学模型构建,多种函数式语言(DSL、SQL、R等)的智能模型构建,确保挖掘的深度和预测分析的精准度。
提供实时交互式查询分析结果的数据化展现,根据分析结果帮助数据科学家进行后续特征工程阶段的工作。
系统自动寻找最优的算法模型以及参数配置,大大降低数据挖掘工具的使用难度,使得一般的业务人员也能够构建针对自身业务的高效智能模型。
为高校提供全面的数据科学教育服务
上海电气风电设备有限公司, 广电总局, 广西电网, 国家工商行政管理总局, 吉林省人力资源和社会保障局, 新华三技术有限公司 杭州市人力资源和社会保障局, 中翼航空投资有限公司, 中央电视台, 安徽省发改委, 上海浦东国际机场
了解更多 SaCa RealRec 数据科学平台,请访问 :http://platform.m.hnmudan.com/allproducts/saca-realrec