新闻稿




数据库阐述

数据库阐述探讨了建筑物的人体和管理数据库。讨论围绕数据建模作为语义过程,以及如何归一化只能在业务规则上下文中函数。沟通很难;一切的含义比我们想承认的更多流体。逻辑与物理或理论与实现之间的大差距始终值得反思。



在关系数据库管理系统中,主体持久数据结构被认为是一个逻辑关系。在RDBMS中对该数据执行的操作也会产生逻辑关系。换句话说,一切都是一个表。让我们从“表”这个词稍微离开一点,用“网格”这个词。

发表于2021年6月10日

22、任何值得做的事,都值得一遍又一遍地去做。对吧?当为数据仓库、中心或其他分析领域构建和标准化新的主题领域或新来源时,一开始经常忽略的任务是引入数据的逻辑。显然,每个人都知道新数据必须经过处理。许多人忽略了这样一个想法,即建立引入数据的过程通常必须进行两次或更多。

发布于2021年4月29日

所有数据架构师都应该将自己视为其工作所在组织的变更代理。但与此同时,企业也希望保持基本不变。当业务人员说希望改变,但他们的行动似乎集中在阻止改变时,这些发现可能会令人困惑。它可以让人想起阿尔伯特·爱因斯坦(Albert Einstein)的名言(或者拉姆·达斯(Baba Ram Dass)的名言,这是根据人们所认同的历史版本而定的):“我们不能用创造问题时使用的思维来解决问题。”

发布于2021年4月6日

仪表板用户在做不到不编程,很大程度上重复,运营报告和分析要求他们支持人员以简单的方式提供数据;他们要求他们的疑问表现快;他们需要快速提供新功能。虽然通常未明确说明,但“简单”数据呈现意味着几个特征。

发布于2021年3月1日

数据湖屋是将公司的数据湖和数据仓库合并为一个平台,消除了数据冗余和数据从一个地方移动到另一个地方的时间损失。这个最新的数据救世主真的比过去所有的数据救世主更好吗?

发布于2021年2月10日

体系结构的力量来自于事物实现方式的一致性级别。然而,这并不是说盲目地追求绝对的一致性是一件好事。当几乎任何规则的例外都是必要的时候,就会出现这种情况。在整个组织中应用决策以形成良好的数据体系结构的技能、艺术和平衡是基于对何时遵从和何时需要异常的谨慎使用。如果有太多的例外,观察员可以理当宣称没有规则,混乱横行。

发布于2021年1月7日

最近的一项研究表明,IT专业人员比其他行业的专业人士不同意其领导力的可能性三倍。识别三次 - 更多的意见差异似乎是一个重要的方差。我不知道学习到达的详细洞察力如何考虑到这种级别的不冶炼水平。也许这项研究认为它是众议员更受教育,更逻辑的,因此更加困难?

发表于2020年12月10日

数据建模与缩写有一个亲密的关系。自创建第一数据模型以来,有些情况,表格或列的完全读写的名称在一个工具或另一个工具内都太长了。偶尔偶尔进入一个无法想象这个星球上任何人都会以不同的方式缩写的人;但是,更多往往往往往往享受一致性,并且尽可能采用规则来支持一致的结果。缩写也不例外。

发表于2020年11月04日

许多分析环境都有着陆区域,许多有停机坪区域,有些两者都有。那么,着陆和准备是同一件事的同义词吗?对使用情况的调查将显示在实现中有很多重叠,甚至有些混淆。

发表于08年10月,2020年

为什么要设一个陷阱让自己在未来的某个时刻失败呢?当您遇到一个实体需要与几乎所有其他实体都有关系的设计时,请停下来想一想发生了什么,并在继续之前检查您的推理。

发表于9月9日,2020年9月

IT管理经常屈服于重复的行为模式。其中一个重复的模式是指责开发人员是“完美主义者”。有问题的开发人员或开发人员会被告知,他们不应该追求完美,因为这种环境不需要完美,而且,更重要的是,追求完美需要的时间太长。开发者是隐藏的完美主义者吗?也许是,也许不是。

发表于2020年8月11日

企业概念数据模型通常被视为一座需要攀登的高山,一段将持续一生的旅程。人们想象在公司办公室里有一堵10英尺或更多的墙,墙上贴着实体关系图(ERD),上面有无数的小盒子和更多的关系线,比所有迪士尼度假区排队的顾客加起来还要多。在这种情况下,企业概念数据模型是一项令人生畏的任务,不能掉以轻心。但是在今天的世界中,企业概念数据模型可以仅仅是主题领域的列表。

发布于2020年7月1日

随着缓慢改变维度(scd)的类型数量的增加,从类型0到类型7结束了,基本上形成了8种类型。但目前尚不清楚的是,对于这八种SCD的具体区别,目前的从业者是否有充分的共识。在定义前三个SCD类型时,每个类型都可以等价于维度属性的结果,这可能会导致一些混淆。类型1具有与维度值相关联的事实,因为它们是当前的,或者总是当前的;类型2具有与维度值相关联的事实,因为当事实被处理时它们是当前的;类型3具有与当前值和处理时当前的值相关联的事实。

发表于2020年6月10日

在构建星型模式时,其中的事实表包含未来的度量,并且任何维度都是Type 2,这可能会导致一些有趣的异常。Type 2维度跟踪其中包含的数据项的更改。实际上,每个维度都包含一个代理键、一个带有开始和停止日期的自然键以及其他描述符列。如果任何描述符列值发生更改,则现有维度行将填充停止日期,同时使用相同的自然键、新的开始日期和新的描述符值插入新行。

发表于5月13日2020年

随着api和微服务的发展,每个组织都有更多的数据存储需要管理,也有更多的数据源需要考虑。由于数据结构的多样性,对操作性解决方案的数据结构进行排序可能会让人头脑麻木,甚至由于许多供应商缺乏细节而令人沮丧。源系统不再是曾经的庞然大物。

发布于2020年4月8日

从首席执行官到总统,VPS,董事,到任何数量的中低位经理,层次结构的概念在组织中是普遍存在的。但是,如果一个人处理关系DBMS,则层次结构仍然是一个尴尬的概念。

发布于2020年3月05日

一个好的数据建模师必须知道什么时候用户需要分析一些东西,即使这些东西不一定是显而易见的。状态中的内容与创建或更改状态所采取的操作、与状态内或跨状态的业务对象的持续时间、与包含它们的业务对象和工作流之间存在着细微的差别。每一个细微之处都以不同的用途驱动不同的指标。

发布于2020年2月10日

当应用的实现工作效率不高时,通常情况下,低效率是由于被称为“搅局”的imp的干扰,也就是说,实现轮子旋转而没有实际进展。生产是坏的。对任何IT项目来说,流失是最具破坏性的环境之一。在项目需求或需求不明确的任何时候,搅局都可能出现。

发表于2020年1月02日

什么是数据架构?随着Zachman Framework很久以前暴露,不同的人寻找不同类型的细节和文档,以回答有关企业架构的基本问题。参与基础架构的某人需要了解所使用的工具以及用于移动数据的方法,并清楚地对安全的概念来执行。但这些方面只是整体架构的初始部分,因此,用于数据架构的全面视图,所使用的工具简单的工具图是不完整的。

发布于2019年12月1日

每个组织都需要数据仓库。数据仓库从未如此适合所有类型的解决方案。存在变化,应该被接受。

2019年10月31日发布

需要以特定方式解决数据建模中的某些问题。可能存在许多选项,但所有可能的选择都非常罕见。使用不太令人满意的路径的原因可能很多。他们可能包括误导关注速度或对问题存在的“在循环中”的控制领域的问题。这在很大程度上,这涉及沟通或更准确地说,缺乏通信。

发表于2019年10月1日

为了保护您的组织,关注已构建的元素至关重要,保持运行进程,并在更改之上。花费必要的时间和资源来正确维护您负责的解决方案。在这种努力中所花费的金额将减少时间,而不是试图在糟糕的事情导致后赶上太多变化的时间。

发表于2019年9月3日

处理和转换大型数据集的有效方法可能包含多个步骤。大数据可能会被分割成几个较小的集合,甚至可能以不同的方式使用共同的和可理解的主题。但是不应该有太多的分裂变体;更确切地说,就像三只熊一样,它应该是合适数量的小数据集。然后,就像解决一个魔方一样,在最后的一两个转折将所有新的和旧的数据点以一种完整和有组织的方式结合在一起。

发表于2019年8月7日

数据虚拟化使一个或多个数据存储能够破坏银行的处理方式,因为它们在物理上只存在一次,但在逻辑上存在于多个已转换的结构中。有时,IT经理会认为数据虚拟化是一种更通用的答案,假设如果它适用于大数据,它就可以适用于所有数据。

发表于2019年7月18日

有时,需要在数据库中具有安全性比可用的更复杂。在特定表上,可能需要将对来自行的子集或特定用户的列子集限制访问。是的,实际上,视图始终存在,确实可以确定视图,可以建立限制行或显示的列。但是,视图只能到目前为止。

发表于2019年6月10日

CDC可以大大减少处理的数据量;但成本是流程本身变得更加复杂,整体存储可能更高。成本在左右移动,最终的处理水平集中在最小的变化上,并且这种最小化是获得效率。前进,使用数据变得标准化并最终简单。

发表于2019年5月01日

在进行多维设计时,应根据护理处理范围内的每个事实表。在理想的世界中,每个低级事实表代表与业务活动有关的指标。理想情况下,一个事实表的含义应该是基于表名和事实表的主要键的组成而显而易见的。决定事实表的主要键是一个重要的选择。

发布于2019年4月9日

清晰的愿景绝对是数据库设计中最重要的部分。数据架构师必须理解被建模数据的形状和模式。当设计者理解主题领域、目标数据库的目标、所涉及的数据源的性质以及范围内数据库对象的内部生命周期时,这种清晰性就出现了。

发表于2019年3月4日

在维度建模中,业务事件通常被指定为事实,而描述性信息元素是尺寸。但是,事件(或有关它们的信息)偶尔将作为尺寸以及事实。一个好的数据架构师必须观察他们的p和q,并且当它适用于一个事实时也可以肯定,或者当双重功能不合适时。

发表于2019年2月08日

通过让规划日期推动工作而不是让工作推动日期,对软件开发做得更好的弊。本规划日期驱动的方法导致更多的压力,更严重的决策,更多的返工,比所有其他原因更加替换,更失败的项目。

发表于2019年1月02日

数据集市的构建者必须理解他们的工作目的是什么。DBMS不会神奇地引导他们找到解决方案。构建器负责了解维度技术如何工作,为什么它们工作,以及维度框架中可能存在哪些选项。

发表于2018年12月4日

虽然关系数据库管理系统仍然是日常的工作,但我们现在正在向混合文档、柱状和图形数据存储及其变体中添加数据存储。每个数据存储都有它擅长的地方,也有它不擅长的地方。同样,根据所选平台的不同,组成数据结构时遵循的规则也有很大的不同。

发布于2018年11月1日

一直以来都需要严格控制一些数据项,比如密码和社会安全号码。今天,随着对个人身份信息(PII)、通用数据保护条例(GDPR)和其他法律规定的关注的增加,必须控制更大的一组数据元素。这些法律数据治理问题可能需要在我们建立数据库设计时加以指导。

发表于2018年10月10日

在建立数据湖的暂存或着陆区域,数据集线器或古色古香的数据仓库环境中,需要建立结构,以模仿源数据,以支持两个非常基本的查询。第一个是:“电流数据集是什么样的?”第二个:“自上次询问以来,源发生了哪些变更活动?”

发表于2018年9月4日

在当今的大数据世界,问题比比皆是。人们讨论结构化数据和非结构化数据;graph vs JSON vs columnar数据存储;甚至批处理和流处理。这些事情之间的区别很重要。它们的使用方式可以帮助指导如何最好地存储供使用的内容。因此,深入理解用法对于确定所采用的数据持久性风格至关重要。

发布于2018年8月8日

当我们听到“跳出思维定式”这个词时,我们有多少次真正审视过这个词的真正含义?首先,一个人需要一个盒子。在这个问题上,大多数人都失败了。在人们考虑什么是“盒子外”之前,必须清楚地理解“盒子内”到底是什么意思。人们通常认为随机方法等同于“打破常规”。然而,仅仅是不同是不够的。

发布于2018年7月2日

在通常情况下,单独的一对多或多种关系,驱动数据库模型中使用的模式。当然,逻辑数据库模型应该代表情况的适当业务语义。但是在物理方面,可能存在扩展的情况,这将导致数据建模器考虑包括一个多对多关系的关联表构造。

发布于2018年6月1日

全球许多组织都吹捧了项目的敏捷方法。IT商店对昂贵的项目令人沮丧,羞怯地对他们的目标令人沮丧的变化。这些焦虑的组织争夺敏捷作为他们的困境的解决方案。

发表于2018年5月8日

对于数据架构师来说,使用数据建模工具对现有解决方案的数据库进行逆向工程是很常见的。逆向工程可能是由于功能原因而发生的,例如收集信息以评估替换选项,或理解解决方案,试图找出应该提取哪些数据以满足下游业务智能需求。

发表于2018年4月12日

许多组织讨论了数据治理,而不是建立涉及每个项目的持续治理过程,该治理被视为一个人任务,以便通过和完成。这种近视方法只会导致失败。数据治理就像生活一样,它是旅程,而不是目的地.Proper数据治理为组织带来了共性;它引领了一个单一版本的真相之旅。一个版本的真相并不意味着每个人都必须kowtow到一个公制,但它确实意味着不同的子组独有的计算,即使这些命名差异是微妙的,也是在公司级别的不同特定名称。

发表于2018年3月7日

业务用户似乎经常被他们所处理的系统所消耗。这使得他们无法定义必要的业务流程或组织的需求。所有这些用户所能做的就是描述他们现成的软件包为他们提供了什么。事实上,大多数用户对自己对当前系统的“理解”感到非常自豪。

发布于2018年2月1日

不要让术语“非结构化数据”迷惑了您。结构以某种方式存在于非结构化源数据中。正是这种微妙的、甚至可能是加密的结构,蕴含着企业所寻求的知识宝石。有时,这些宝石只有在从其他数据源提取并与其他小宝石相结合时才会发光。

发表于2018年1月02日

不,我们不是在交火时的飓风中出生的,也不是在学校里被皮带绑在背上的;我们还有其他危机、复杂的优先事项和资源不足需要应对。但现在没事了。事实上,它是气体。那些希望在IT行业生存下来的人几乎没有选择。要么应对不断变化的环境,要么进入另一个行业。即使不是全世界,也遍布全国的科技商店都处于危机之中。唯一的问题是,这场危机已经持续了几十年甚至更久。

发布于2017年12月1日

IT领域的领导能力是动态的。在某个时期,似乎任何人都可能被领导角色所打动。数据人员(dba、数据架构师、数据建模师)往往最终被认为是非正式的领导(很大程度上是因为他们是团队中更聪明的人)。一个领导,无论是官方的还是非官方的,都有一些责任。

发布于2017年11月1日

操作系统是数据出生的地方。这些系统要么迫使人们输入他们的细节或从可信来源获取相同的信息。消耗名称,地址,商品选择和信用卡号。运营解决方案与用户和Compatriot应用程序互动以生出他们的Raison d'Etre,是它购买订单,工资支票或其他数千个其他文件和交易。

发布于2017年10月18日

每隔几年我们听到一个新的想法或产品,肯定会使关系数据库或死亡到数据仓库,或死亡到某事物。看来很多人更喜欢看到死亡,或者至少他们很大程度上享受计划。这些总结似乎从未到达过。

发布于2017年9月7日

有一个古老的笑话,纽约市的游客在观光时失去,并注意到一个留出租车的音乐家;他走到音乐家并问道,“你怎么去卡内基大厅?”音乐家回应,“练习,练习,练习。”显然,这种笑话被注定为默默无闻,因为人们现在将只是在手机上使用导航应用程序。但是,以自己的方式,建议本身将永远是相关的实践,练习,练习。

发表于2017年8月09日

对于每个人都归一化他们的设计,只需记住:没有作为部分外键的东西。当一个项目假装部分外语是一个有效的概念时,最终结果是一个数据库模型,它可以位于观看者,或者没有将必要的信息易于加入表格。

发表于2017年7月05日

更新Star Schema表中的事实行从来都不是最好的实践。即便如此,某些组织也会沿着这条道路进行旅行。

发布于2017年6月1日

在设计数据库时,选择是普遍存在的。数据建模师必须处理一系列问题:哪些想法是重要的?哪些物体突出?哪些概念可以退居次要地位?除了这些决策之外,还需要了解目标结构。一个规范化的设计可能向一个方向倾斜,而一个维度的设计可能向另一个方向倾斜。

发表于2017年5月05日

页面
1
2
3.
4.