-
挖掘隐式启动Activity可能存在的坑
所属栏目:[大数据] 日期:2020-12-25 热度:165
今日科技快讯 很早之前,谷歌母公司Alphabet的董事长施密特就曾经表示,在中国市场,谷歌需要寻找到一个商业伙伴来开展自身的一些业务。而 近日有消息传出,谷歌和网易正在进行合作磋商,很可能是成立合资公司,在国内推出针对中国市场的Google Play应用商店[详细]
-
3.21.1、BI之SSIS之数据流转换(渐变维度-混合模式)
所属栏目:[大数据] 日期:2020-12-25 热度:156
BI之SSIS之数据流转换(渐变维度-混合模式) ? ? 1??????????3.21中介绍了普通模式的渐变维度,即通过时间标志来对维度属性值的变化进行记录,这种方式可以很直观的看到变化的时间点,但是在使用时却比较麻烦,因为你需要通过时间字段去判断 ? 2??????????这[详细]
-
[bigdata-039] pysql+pymongo+py3把数据从sql 导入 到mongo的通
所属栏目:[大数据] 日期:2020-12-25 热度:133
#!/usr/bin/env python3#! coding:utf-8 -*-import pymysqlimport pymongodef trans_data_from_mysql_to_mongo(source_param,target_param,trans_type,where_clause,ignore_columns=[]): # 创建mysql连接 mysql_conn = pymysql.connect(host=source_param['d[详细]
-
使用机器学习和大数据预测心脏病
所属栏目:[大数据] 日期:2020-12-25 热度:124
编者按: 现在公众号有置顶功能了,大家把微信更新到最新版本,点开“大数据实验室”公众号。点“ 置顶公众号 ”键,就可以置顶了,这样。不管我们什么时候更新,您都能容易找到。 大数据和机器学习的组合是一项革命性的技术,如果以恰当的方式使用它,它可[详细]
-
[bigdata-040] cloudera manager web服务故障处理
所属栏目:[大数据] 日期:2020-12-25 热度:122
1. cloudera manager的web服务挂了 2. 根据文档进行重启 https://www.cloudera.com/documentation/enterprise/5-4-x/topics/cm_ag_server.html sudo service cloudera-scm-server start 无效,在10.14.x.x:7180上没有服务 lsof -i:7180上能看到端口占用。 检[详细]
-
HDU 2054 大数比较
所属栏目:[大数据] 日期:2020-12-25 热度:149
题目传送门:http://acm.hdu.edu.cn/showproblem.php?pid=2054 ???? ?? A这个水题也没有什么意思,主要巩固前面Java大数类和一些方法的学习。 ??? ?? 题目如果直接用Java.Biginteger.equals()方法的话会WA,在API说明里面,对于2.00,和2.0值相等,标度不等[详细]
-
[bigdata-036] mit-scheme试用
所属栏目:[大数据] 日期:2020-12-24 热度:147
1. 安装Mit-scheme apt-get install mit-scheme 2. 写一个hello wold代码, hi.scm (begin (display "Hello,World!") (newline)) 3. 在命令行执行 scheme,进入交互界面,然后输入命令 (load 'hi.scm') 将执行这个文件,然后输出 "Hello,World!" 4. scheme语[详细]
-
[bigdata-037] docker hue 用SQL获取数据以及可视化
所属栏目:[大数据] 日期:2020-12-24 热度:168
1. hue官网 https://github.com/cloudera/hue http://gethue.com/ 2. hue的功能 有py2+django开发,提供Hive,Impala,MySQL,Oracle,PostgreSQL,Spark SQL,Solr SQL,Phoenix...等SQL数据获取和页面展示 3. 用docker 安装hue docker pull gethue/hue 4. hue ima[详细]
-
[bigdata-037]apache hue 用SQL获取数据以及可视化
所属栏目:[大数据] 日期:2020-12-24 热度:84
1. hue官网 https://github.com/cloudera/hue http://gethue.com/ 2. hue的功能 有py2+django开发,提供Hive,Impala,MySQL,Oracle,PostgreSQL,Spark SQL,Solr SQL,Phoenix...等SQL数据获取和页面展示 3. 用docker 安装hue docker pull gethue/hue 4. hue ima[详细]
-
[bigdata-038] tushare 金融数据 安装使用
所属栏目:[大数据] 日期:2020-12-24 热度:109
1. 安装 pip install tushare 2. 获取股票的基本面 #!/usr/bin/env python3#!-*- coding:utf-8 -*-import tushare as ts#显示基本信息res = ts.get_stock_basics()print(res)print(type(res)) res是的类型是pandas.core.frame.DataFrame,3114? x 22 的矩阵[详细]
-
[bigdata-033] 互联网金融-大数据架构平台和业务流程
所属栏目:[大数据] 日期:2020-12-24 热度:68
一张图,excited![详细]
-
BloomFilter——大规模数据处理利器
所属栏目:[大数据] 日期:2020-12-24 热度:106
原文:http://www.cnblogs.com/heaad/archive/2011/01/02/1924195.html 笔记: 类似bloombit,用来查找某个东西是否存在,可以允许少量错误率 bloombit 先定义一个bit数组,插入时将数据hash后置位相应的位,查询时看相应的位是否置位,这样会有一定的出错概[详细]
-
电商如何上了bi的道?
所属栏目:[大数据] 日期:2020-12-24 热度:75
(这就不要跟我提淘宝京东唯品会之类的了,这条道本就是他们趟出来的,以下主要针对垂直电商以及传统零售转电商一类) BI这条道不再新鲜了,但也是有些公司上来了,有些没上来。没上来的可能还不确定什么时机该上,上来的也是各有各的苦衷,家家有本难念的经[详细]
-
算法训练 区间K大数
所属栏目:[大数据] 日期:2020-12-24 热度:130
算法训练 区间k大数查询 ? 时间限制:1.0s ? 内存限制:256.0MB ? ? 问题描述 给定一个序列,每次询问序列中第l个数到第r个数中第K大的数是哪个。 输入格式 第一行包含一个数n,表示序列长度。 第二行包含n个正整数,表示给定的序列。 第三个包含一个正整数m[详细]
-
[bigdata-34] pyenv + anaconda 4.2 + python3.5+ ubuntu 16.04
所属栏目:[大数据] 日期:2020-12-24 热度:177
1. pyenv 官网 https://github.com/yyuu/pyenv 2. 安装 git clone https://github.com/yyuu/pyenv.git ~/.pyenv echo 'export PYENV_ROOT="$HOME/.pyenv"' ~/.bashrc echo 'export PATH="$PYENV_ROOT/bin:$PATH"' ~/.bashrc echo 'eval "$(pyenv init -)"' ~[详细]
-
MPP DB 是 大数据实时分析系统
所属栏目:[大数据] 日期:2020-12-24 热度:117
大数据领域,实时分析系统(在线查询)是最常见的一种场景,前面写了一个《 实时分析系统 (HIVE/HBASE/IMPALA) 浅析 》讨论业界当前常见的方案。互联网公司用得比较多是 HIVE/HBASE ,如腾讯基于 HIVE 深度定制改造,改名为 TDW ,小米等公司选用 HBASE 等。[详细]
-
BI学习计划
所属栏目:[大数据] 日期:2020-12-24 热度:86
1??????????《数据仓库》——比尔.恩门,主要介绍什么是数据仓库 2??????????SSIS设计与开发 2.1?????????BIWORK的微软SSIS系列 2.2?????????微软MSDN之SSIS系列 3??????????SSAS设计与开发 3.1?????????BIWORK的微软SSIS系列 3.2?????????微软MSDN之SSIS系[详细]
-
BI导论——数据仓库概论
所属栏目:[大数据] 日期:2020-12-24 热度:66
1??????????书名《Building the Data WareHouse》作者:比尔.恩门 2??????????目的:将积累的数据变成信息,以建立决策支持系统(DSS) 3??????????原有的DSS是分裂的,按需抽取的,导致重复与低效 4??????????原始数据与DSS数据对比与差异 4.1?????????原始[详细]
-
[bigdata-035]用js dtree展示一个树形结构 py3+dtree+jquery
所属栏目:[大数据] 日期:2020-12-24 热度:155
1. dtree的下载 http://destroydrop.com/javascripts/tree/default.htm 2. 目录结构 . ├── static │?? ├── css │?? │?? └── dtree.css │?? ├── img │?? │?? ├── base.gif │?? │?? ├── cd.gif │?? │?? ├── diffDoc.gif │??[详细]
-
[编程题]数字翻转(大数加法)
所属栏目:[大数据] 日期:2020-12-24 热度:124
对于一个整数X,定义操作rev(X)为将X按数位翻转过来,并且去除掉前导0。例如: 如果 X = 123,则rev(X) = 321; 如果 X = 100,则rev(X) = 1. 现在给出整数x和y,要求rev(rev(x) + rev(y))为多少?? 输入描述: 输入为一行,x、y(1 ≤ x、y ≤ 1000),以空格隔开[详细]
-
[BZOJ1670][Usaco2006 Oct]Building the Moat护城河的挖掘(凸包
所属栏目:[大数据] 日期:2020-12-24 热度:54
题目描述 传送门 题解 凸包裸题。 代码 #includealgorithm #includeiostream #includecstring #includecstdio #includecmath using namespace std ; #define N 5005 const double eps= 1e-9 ; int dcmp( double x){ if (x=epsx=-eps) return 0 ; return (x 0[详细]
-
N的阶乘(大数阶乘算法)
所属栏目:[大数据] 日期:2020-12-24 热度:56
Problem Link:点击打开链接 题目描述 ?输入一个正整数N,输出N的阶乘。? 输入描述: 正整数N(0=N=1000) 输出描述: ?输入可能包括多组数据,对于每一组输入数据,输出N的阶乘 输入例子: 4515 输出例子: 241201307674368000 AC code: #includeiostream#includ[详细]
-
2017年商业智能 BI 发展趋势分析
所属栏目:[大数据] 日期:2020-12-24 热度:94
转载自公众号:天善智能(ID:tianshansoft) 作者:吕品,天善智能联合创始人运营总监? 导读 本文主要涉及到以下四个方面的内容: 1. 传统 BI 和新型 BI 的分水岭(2013年) 2. 新型 BI 的高速发展期和传统BI的衰退(2013年-2016年) 3. 传统 BI 巨头下滑期[详细]
-
a+b(大数加法)
所属栏目:[大数据] 日期:2020-12-24 热度:192
Problem Link:点击打开链接 题目描述 实现一个加法器,使其能够输出a+b的值。? 输入描述: 输入包括两个数a和b,其中a和b的位数不超过1000位。 输出描述: 可能有多组测试数据,对于每组数据,输出a+b的值。 输入例子: 2 610000000000000000000 1000000000000[详细]
-
流式大数据处理的三种框架:Storm,Spark和Samza
所属栏目:[大数据] 日期:2020-12-24 热度:151
许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对三种Apache框架分别进行简单介绍,然后尝试快速、高度概述其异同。 Apache Storm 在 Storm 中,先要设计一个用于实时计算的图状结构,我们称之为拓扑(topology)。这个拓扑将会被提交给集群[详细]