analytical

程序员笔记|3个问题带你入门数据建模

对着背影说爱祢 提交于 2020-03-03 12:37:15
作者介绍:韩锋:宜信数据库开发与管理主任工程师 ACMUG主席团成员,CCIA(中国计算机行业协会)常务理事,Oracle ACE,DBAplus联合创始人,ODF 顾问团成员,ACOUG,ACMUG,DBGeek撰稿人,著有《SQL优化最佳实践》一书。早年从事软件开发工作,后因个人兴趣转入数据库领域。有着多年的一线数据库架构、设计、开发经验,曾担任多家公司首席DBA、数据库架构师等职。 【技术沙龙002期】数据中台:宜信敏捷数据中台建设实践|宜信技术沙龙 将于5月23日晚8点线上直播,点击报名 一、何为建模? 数据几乎总是用于两种目的: 操作型记录的保存 和 分析型决策的制定 。简单来说,操作型系统保存数据,分型型系统使用数据。 前者一般仅反映数据的最新状态,按单条记录事务性来处理;其优化的核心是更快地处理事务。 后者往往是反映数据一段时间的状态变化,按大批量方式处理数据;其核心是高性能、多维度处理数据。 通常我们将操作型系统简称为OLTP(On-Line Transaction Processing)— 联机事务处理,将分析型系统简称为OLAP(On-Line Analytical Processing)— 联机分析处理。 针对这两种不同的数据用途,如何组织数据,更好地满足数据使用需求。这里就涉及到数据建模问题。即设计一种数据组织方式(模型),来满足不同场景。在OLTP场景中

Develop multilingual system

霸气de小男生 提交于 2020-01-15 08:24:40
问题 This is more of an analytical question. I need to know how best to make a multilingual system, a.k.a. a system where the user can change the language. The language will be stored in a cookie or a database. I've worked in the past with different files for each language, for example: nl.php $lang['hi'] = 'Hoi'; $lang['howareyou'] = 'Hoe gaat het?'; en.php $lang['hi'] = 'Hi']; $lang['howareyou'] = 'How are you?'; index.php include($language . '.php'); As you can see, this system is both

Develop multilingual system

随声附和 提交于 2020-01-15 08:24:11
问题 This is more of an analytical question. I need to know how best to make a multilingual system, a.k.a. a system where the user can change the language. The language will be stored in a cookie or a database. I've worked in the past with different files for each language, for example: nl.php $lang['hi'] = 'Hoi'; $lang['howareyou'] = 'Hoe gaat het?'; en.php $lang['hi'] = 'Hi']; $lang['howareyou'] = 'How are you?'; index.php include($language . '.php'); As you can see, this system is both

Mixpanel.track from the controller

北城余情 提交于 2020-01-02 21:48:42
问题 I have an application that has a simple form submission (an email). I have MixPanel's tracking analytics integrated into the app, and want to track every time an interaction with this form happens--specifically, when a user successfully/unsuccessfully submits the form, and what their email is. After doing some research, it seems simplest method is to track at the controller level (where I am running validations, and making the overall decision whether or not the submission is legitimate).

Mixpanel.track from the controller

╄→尐↘猪︶ㄣ 提交于 2020-01-02 21:48:06
问题 I have an application that has a simple form submission (an email). I have MixPanel's tracking analytics integrated into the app, and want to track every time an interaction with this form happens--specifically, when a user successfully/unsuccessfully submits the form, and what their email is. After doing some research, it seems simplest method is to track at the controller level (where I am running validations, and making the overall decision whether or not the submission is legitimate).

跨越数据库发展鸿沟,谈分布式数据库技术趋势

 ̄綄美尐妖づ 提交于 2019-12-13 17:02:29
【推荐】2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 金融行业架构转型需求 随着移动化与互联网化的不断发展,我国金融行业的商业模式与技术体系已经逐渐走上了与西方世界完全不同的道路。众所周知,欧美国家的移动化普及率远远不如我国,同时人口基数也有着数量级的不同,这就使得国内外金融行业所面临的业务类型、数据量、并发量都存在巨大的差异,导致对整个IT基础设施的需求截然不同。 在最近的一两年中,国内部分科技领先的银行已经率先对微服务与分布式技术进行了探索,一些新建的互联网金融类业务也已经开始尝试使用微服务架构、分布式技术、DevOps框架进行应用的开发与维护。甚至一些银行在规划下一代核心体系架构时,也会尝试适当引入分布式架构,以满足未来业务压力与数据量不断增长的需求。 与新一代分布式架构相比,中间件加数据库的传统“烟囱式”架构在面向海量数据、高并发、高响应速度的业务应用时存在诸多问题。 从业务部门和系统来看,复杂的业务导致企业中系统数量多、分散、数据之间完全隔离无法共享; 系统缺乏灵活的水平伸缩能力,性能瓶颈明显,很容易遇到硬件瓶颈,无法满足弹性扩张的业务需求 系统无法快速响应顺势爆发的海量请求,例如双十一期间、秒杀等业务导致的瞬时爆发性增长很难处理; 采购和运维成本高昂,小型机设备与软硬件分别采购独立运维,导致整体拥有成本高昂; 缺乏自主掌控能力,高度依赖国外的厂商

C++: Extracting symbols/variables of an analytical mathematical expression

北慕城南 提交于 2019-12-07 18:06:51
问题 I have expressions that can be provided by the user, such as: a*sin(w*t) a+b/c x^2+y^2/2 And I would like to just get the list of variables there. I don't need to do any substitutions. So, for the first formula it's gonna be {a,w,t} . For the second one {a,b,c} , and for the last one {x,y} . The expression is primarily written to be parsed with Sympy, but I need to be able to get the list of variables in C++ for some checks. I would like to: Avoid having to link the whole Python interpreter

混合事务分析处理“HTAP”的技术要点分析

冷暖自知 提交于 2019-11-30 09:37:46
HTAP是近些年来比较火的一个概念,本文将聊聊HTAP的前世今生及技术特点。 一、数据应用类别 根据数据的使用特征,可简单做如下划分。在选择技术平台之前,我们需要做好这样的定位。 1.1 OLTP 联机事务处理OLTP(On-Line Transaction Processing) OLTP是事件驱动、面向应用的,也称为面向交易的处理过程。其基本特征是前台接收的用户数据可以立即传送到计算中心进行处理,并在很短的时间内给出处理结果,是对用户操作的快速响应。例如银行类、电子商务类的交易系统就是典型的OLTP系统。 OLTP具备以下特点: 直接面向应用,数据在系统中产生。 基于交易的处理系统。 每次交易牵涉的数据量很小;对响应时间要求非常高。 用户数量非常庞大,其用户是操作人员,并发度很高。 数据库的各种操作主要基于索引进行。 以SQL作为交互载体。 总体数据量相对较小。 1.2 OLAP 联机实时分析OLAP(On-Line Analytical Processing) OLAP是面向数据分析的,也称为面向信息分析处理过程。它使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的。其特征是应对海量数据,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果,例如数据仓库是其典型的OLAP系统。 OLAP具备以下特点: 本身不产生数据

TiFlash & TiSpark?那都是 AP 团队开的坑 !

久未见 提交于 2019-11-29 22:38:16
前面两期我们介绍了 TiDB 团队 和 TiKV 团队 ,颇受好评,今天我司数据库专家 马晓宇 老师将为大家介绍 PingCAP 最具活力的团队—— AP(Analytical Product) 团队,如果你对亲手打造酷炫的大数据分析产品感兴趣,就快快投个简历来和我们聊聊吧~ 大家都知道 TiDB 是一款定位于在线事务处理/在线分析处理( HTAP: Hybrid Transactional/Analytical Processing)的融合型数据库产品, 加强和补齐 HTAP 中的 AP 环节是这个团队的重要工作职责 。 TiDB 的 Coprocessor(协处理器)架构使得大量计算可以并行进行,例如由协处理器进行谓词过滤,预聚合等等,这样一来很多计算被众多 TiKV 资源分担,并且汇聚到 TiDB 的计算将大大减少,由此虽然 TiDB 本身仍然是单机,却可以很大程度满足 AP 需求。 不过这并不是 AP 团队工作的全部。 TiFlash TiFlash 是一个相对独立完整的分析型数据库产品。独立,说明历史包袱会比较小,可以尝试各种可能的设计;同时,我们也希望它尽可能完整,能承担一个分析型数据库应有的职责 。这个项目需要熟悉 C++,熟悉分布式系统的 Infra 工程师同学们入伙。 Why 也许您看了 TiDB / TiSpark 的架构,会有个疑问。TiDB

How to use Analytic/Window Functions in Spark Java?

故事扮演 提交于 2019-11-29 14:48:46
I'm trying to use analytical/window function last_value in Spark Java. Netezza Query: select sno, name, addr1, addr2, run_dt, last_value(addr1 ignore nulls) over (partition by sno, name, addr1, addr2, run_dt order by beg_ts , end_ts rows between unbounded preceding and unbounded following ) as last_addr1 from daily We want to implement this query n Spark Java (Without using HiveSQLContext): import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaRDD; import org.apache.spark.api.java.JavaSparkContext; import org.apache.spark.sql.expressions.Window; import org.apache.spark.sql