我们采用“参考”各种数据来源去获取信息的技术方案,通过将各种数据源进行整合,以提高数据的准确度。
我们拥有专业的数据清洗过滤技术,可以有效识别和清除失效和干扰数据,从而达到建模分析可用的标准。
我们通过Spike Detection和Noise Clean的内部过滤技术,可以识别并处理因GPS点漂移或者失效导致的异常数据,并对GPS噪声进行过滤处理。
不同手机传感器精度不同,直接使用误差会非常大。我们采用动态扩展卡尔曼滤波器实现传感器信号自动降噪,最大限度保留了原始sensor提供的信息,通过对sensor数据的分析计算以判断或预测当前用户的行为。
我们采用POI精准映射技术,匹配真实地图,以更全面、更准确的方式来实现智能化
通过业界最高质量的基准地图,结合移动设备的禁止和移动状态得出数亿个准确的真实兴趣点。
利用神经网络及马尔科夫链技术,抽取不同行为模式对应sensor信号的74种特征及特征变迁规律,实现用户行为精准判断。
我们构建了一个快速的、主动的、基于深度学习的数据算法模型,更准、更全、更省时省力。
通过深度学习模型对用户GPS点的主动学习,自动完成用户行为的特征工程标记。
克服了k-means算法需要人工指定聚类中心数量的缺点,实现了快速、低复杂度的常去地点发现。
使用足迹归类算法与斑马地理围栏数据库及POI编码体系配合使用,从而深度剖析用户画像特征。
为满足处理大数据的大规模性、多维度性、价值密度低、时效要求高、数据质量层次不齐的5V特性,我们在基于目前最主流的开源大数据Hadoop、Spark、 Flink、Tensorflow等平台基础上,改造和运维搭建了一套支持实时/离线数据计算、深度学习、价值挖掘、交互式查询的大数据综合平台,可处理PB级别的数据。
我们构建了一整套安全体系,为企业提供敏感数据私有化、采集数据全方位保障。
对于用户的真实信息,通过虚
拟ID的方式进行用户隔离
HTTPS协议保障数据传输安全
完备的监控体系、及时处理问
题能力
底层大数据架构平台增强高可
用性
后台多重权限管理