字节跳动也是 Hadoop 生态组件的重度用户。这十年在业务演进的过程中,字节跳动锤炼出了自己的一套方法,他们在保持接口不变的条件下,对底层做了大量的定制化甚至是重写工作。作为火山引擎云原生计算研发负责人,李亚... 风控安全、实时大屏等等。在进行实时信息流推荐时,每次用户刷新,App 就会从亿万级别的内容库里,选出用户感兴趣的内容,经过粗排、精排,对这些内容进行打分排序等一系列计算,选出用户感兴趣的内容,这些都跟计算相关。...
字节跳动也是 Hadoop 生态组件的重度用户。这十年在业务演进的过程中,字节跳动锤炼出了自己的一套方法,他们在保持接口不变的条件下,对底层做了大量的定制化甚至是重写工作。作为火山引擎云原生计算研发负责人,李亚... 风控安全、实时大屏等等。在进行实时信息流推荐时,每次用户刷新,App 就会从亿万级别的内容库里,选出用户感兴趣的内容,经过粗排、精排,对这些内容进行打分排序等一系列计算,选出用户感兴趣的内容,这些都跟计算相关。...
也是内部业务重度依赖的两大产品。 字节跳动 NoSQL 的最新实践 字节跳动的大部分业务数据可归纳为以下几种类型:* 用户之间的关系:比如关注好友等;* 内容:视频、文章、广告等... 在风控场景,业界以前的常用做法是使用 HBase 加上一个计算引擎。实际上图计算对于风控反作弊的异常识别和风险检测更适合。* **推荐模型**:图训练系统也支持推荐的核心模型,这也是字节跳动的的一个核心场景。...
也是内部业务重度依赖的两大产品。## 字节跳动 NoSQL 的最新实践字节跳动的大部分业务数据可归纳为以下几种类型:- 用户之间的关系:比如关注好友等;- 内容:视频、文章、广告等;- 用户和内容的连接:用户发布... 风控反作弊:在风控场景,业界以前的常用做法是使用 HBase 加上一个计算引擎。实际上图计算对于风控反作弊的异常识别和风险检测更适合。- 推荐模型:图训练系统也支持推荐的核心模型,这也是字节跳动的的一个核心场...
**字节跳动也是 Hadoop 生态组件的重度用户。这十年在业务演进的过程中,字节跳动锤炼出了自己的一套方法,他们在保持接口不变的条件下,对底层做了大量的定制化甚至是重写工作** 。作为火山引擎云原生计算研发负责... 风控安全、实时大屏等等。在进行实时信息流推荐时,每次用户刷新,App 就会从亿万级别的内容库里,选出用户感兴趣的内容,经过粗排、精排,对这些内容进行打分排序等一系列计算,选出用户感兴趣的内容,这些都跟计算相关。...
业务运营重度依赖数据,每天都需要根据数据来做决策,数据必须准时产出。这就带来了第三大挑战,就是稳定。 要想稳,实际上有一些基础的工作,比如监控、运维质量等。我这里想讲的一点是数据治理,在实时、敏捷的同时保证... 对运营和风控等一线人员,他们可能需要看业务数据,比如罗盘,同时他们也可能需要BI(敏捷分析平台),可能需要人群画像、行为分析等等能够指导一线工作的工具。因此我们针对不同的业务角色,也会去专门地定制不同的产品来...
属于重度算力要求服务。视频处理、机器学习和大数据服务属于偏离线的服务,它们为推广搜离线训练、视频处理、数据报表提供数据处理支持,通常运行在 Hadoop、Mesos 等调度系统上。基于上述业务类型划分,云原生技术在字节跳动业务中的落地过程如下图所示:![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/b6688227169447ad9fc63395bfbf964b~tplv-tlddhu82om-image.image?=&rk3s=8...
而这些重度汇总过后的实时数据使用率相对来说是比较低的。因此我们和数仓的同学共同推进了一个实时多维汇总的方案落地。数仓的同学通过实时计算引擎完成数据的多维度的轻度汇总,并且实时地更新入湖。下游可以灵活地按需获取重度汇总的数据,这种方式可以缩短数据链路,提升研发效能。![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/1345f91ed15643acbe8601efe9d522a6~tplv-tlddhu82om-ima...
**DataWind重度使用了图表组件VChart和多维表格组件库 VTable。** 同时DataWind研发团队与VisActor团队深度合作,参与开源建设,使得一些个性化需求可以得到快速满足。 VChart几乎覆盖了所有常见的统计图表类型,并且提供了丰富的扩展接口。这使得 DataWind 在根据用户反馈扩充图表类型,增强图表能力变得非常容易。 ![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/...
TCC 模式下的微服务需要业务代码重度耦合,实际编码的体感很不好,需要借助于外部的 TCC 框架,同时需要在业务代码中增加 Try、Cancel 处理流程需要的接口。上述的 TCC 解决方案,需要在用户执行完下单操作之后依次执行订单生成接口、库存扣减接口以及用户积分接口来完成整体的业务操作,但是在实际的业务场景中,我们大概率不会这么同步调用多个接口来完成具体业务,下面我们看看另外一种分布式数据一致性解决方案。### (2)可靠消息最...
而这些重度汇总过后的实时数据使用率相对来说是比较低的。因此我们和数仓的同学共同推进了一个实时多维汇总的方案落地。数仓的同学通过实时计算引擎完成数据的多维度的轻度汇总,并且实时地更新入湖。下游可以灵活地按需获取重度汇总的数据,这种方式可以缩短数据链路,提升研发效能。![picture.image](https://p6-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/1e3e3e128b2c466186460415442fe001~tplv-tlddhu82om-image...
像Hive就重度依赖于YARN体系,计算引擎也与MR强绑定,在解耦方面较弱,如果企业考虑在K8S上构建自己的计算引擎,Hive面临的局限会更加明显。* 性能:整体架构是否拥有更好的性能。* 安全:是否支持不同级别,不同力度的用户访问和数据安全鉴权体系。对于企业数仓架构来说,最重要的是如何基于企业业务流程来设计架构,而不是基于某个组件来扩展架构。 ![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn...
值得重度投入,后续有不错进展的话,我们会及时分享。--- *文/远洋关注得物技术,每周一、三、五更新技术干货 要是觉得文章对你有帮助的话,欢迎评论转发点赞~ 未经得物技术许可严禁转载,否则依法追究法律责任。 “ **扫码添加小助手微信**如有任何疑问,或想要了解更多技术资讯,请添加小助手微信:![picture.image](https://p3-volc-community-sig...