大数据收集清洗
大数据存储
通过采集清洗,对多源异构数据进行整合集成,产出高质量,最新,完整的大数据
采用分布式文件系统支撑海量数据,智能资源分配,存储业务数据,主题数据,日志数据
大数据计算
针对TB量级数据,以分钟、小时、天 为单位产出应用数据;实时数据秒级处理,支撑关键业务线应用
数据仓库
BI平台
持续打造统一的,规范的数据仓库
BI平台,轻松助力精细化运营
行业知识库
用户画像
丰富的跨行业知识库
集成线上线下数据,定制用户标签,打造用户画像,支撑智能广告分发
大数据风控
用户统一身份id
流量反作弊,反欺诈筛查,过滤刷单数据,提升广告有效率
建立用户和设备的唯一身份标识
数据安全保护
敏感数据管理
传输过程加密,升级数据防护系统,提升数据安全保护
数据分类分级,敏感信息全部脱敏,严格管控数据访问权限
访问稽核
数据访问过程监测评估,保证安全策略有效执行,规避潜在安全风险
NLP基础技术
NLP解决方案
在词法分析、句法分析、实体/概念识别、关键词抽取、主题模型、主题归类等基础NLP技术方向有扎实的技术积累
拥有业内优秀的文章分类、文章标签、内容语义理解、信息流商业词挖掘及抽取解决方案
CV基础技术
CV解决方案
在图像分类、目标检测、图像匹配等通用计算机视觉方向上具有一定的技术积累和前沿探索
探索了具有高技术难度的细粒度商品识别、时装分析等任务在智能营销场景上的解落地,获得更好的广告投放效果
机器学习及深度学习平台
分布式机器学习及深度学习训练框架
底层核心算法与业务线解耦,平台上集成业内多种优秀的机器学习和神经网络算法,导入数据自动执行机器学习流程产出模型评估及提供部署支持,高效支持业务线,是算法中台的重要支撑
拥有自研的大规模分布式机器学习训练框架,并针对主流的深度学习框架做了高效封装,使机器学习算法能够在T级数据下快速分布式训练,提高模型迭代效率
基于海量内容的理解及用户兴趣建模提供个性化内容推荐
基于用户画像数据还海量用户行为数据,借助大数据分析、机器学习和深度学习技术,针对特定人群包进行精准化广告投放