昨天跟相关同事聊到维度建模时,发现有些概念还是容易搞混的,其实把不同层面的概念放在一起比较本身是不太合适的,但对这些问题能够顺利、准确的说清楚,那其实也并不容易。
这篇就来说说大数据中的主数据和数仓中的维度数据。
more >>给自己定个小目标,例如先写个十年代码,然后考虑再写二十年!
more >>OceanBase是一款由阿里巴巴/蚂蚁集团完全自主研发的企业级分布式关系数据库,始创于2010年。OceanBase具有数据强一致、高可用、高性能、在线扩展、高度兼容SQL标准和主流关系数据库、低成本等特点。2020 年 5 月,OceanBase 以 7.07亿 tpmC 的在线事务处理性能,打破了 OceanBase 自己在 2019 年创造的 6088万 tpmC 的 TPC-C 世界纪录。截止至目前,OceanBase是第一个也是唯一一个上榜的中国数据库。目前,OceanBase已应用于很多金融行业企业,在南京银行、人保健康险、西安银行、广东农信、天津银行等多家商业银行和保险机构上线。
近一年来的状态一直不好,显得有点颓废,但今天早晨在听着vision pro发布会音频的时候突然有种热泪盈眶的感觉。然后就想到了这句话,第一次见到这句话应该是在某个摇滚音乐会的宣传画上。
我心态发生了这么大的变化,就是没有了热泪盈眶的冲动。
more >>在建立好数据表之后就要考虑指标怎么建了,毕竟大数据的上层应用最重要的一个就是报表展示,很多时候也都是企业需要做报表才去建数仓。
这篇文章来聊一聊指标体系的建设。
指标是衡量业务特征的统计数值,用于体现企业某一业务活动的业务状况。指标通常分为原子指标和派生指标,与指标相关的参数还包括修饰词和时间周期。派生指标则是由原子指标 + 时间周期 + 一个或多个修饰词
组成。
在做数仓建设的时候我们需要根据业务需求建各种表,国内因为阿里做的比较早,基本上就跟随着阿里的这套方法论走下去了,所以能查到的凡是跟维度建模相关的资料都是以阿里的这套为基础来的。
其实阿里的这套数据管理体系、数据建模体系是基于Kimball来的。
这篇文章来说说在数仓中常见的集中表类型。
more >>一般企业的数字化发展到一定阶段的时候就会有数据分析、数据挖掘等高层次的数据需求,这时候会开始考虑建设数据仓库,一般数据仓库分离线数据仓库和实时数据仓库,这两种类型怎么选?各有什么特点?
来跟大家聊一聊。
more >>某次小猪接到一个很重要的电话,于是便有了以下场景:
Other:诶,你好,是xxx吗?,
Me:你好,是我,能听见我说话吗?
Other:能听见,那我们聊正事吧。
Me:好的,开始吧。
Other:xxxxxx
这个过程让我瞬间想起来咱们经典的TCP链接三次握手的过程。
more >>tag:
缺失模块。
1、请确保node版本大于6.2
2、在博客根目录(注意不是yilia根目录)执行以下命令:
npm i hexo-generator-json-content --save
3、在根目录_config.yml里添加配置:
jsonContent: meta: false pages: false posts: title: true date: true path: true text: false raw: false content: false slug: false updated: false comments: false link: false permalink: false excerpt: false categories: false tags: true