当前位置: 首页 > news >正文

wordpress修改文章字体大小上海站群优化

wordpress修改文章字体大小,上海站群优化,wordpress膜版教程视频,wordpress如何配置sslHive Sampling 抽样函数 文章目录Hive Sampling 抽样函数Random随机抽样Block 基于数据块抽样Bucket table 基于分桶表抽样语法在HQL中,可以通过三种方式采样数据:随机采样,存储桶表采样和块采样。Random随机抽样 随机抽样使用rand()函数确保…

Hive Sampling 抽样函数

文章目录

  • Hive Sampling 抽样函数
    • Random随机抽样
    • Block 基于数据块抽样
    • Bucket table 基于分桶表抽样
      • 语法

在HQL中,可以通过三种方式采样数据:随机采样,存储桶表采样和块采样。

Random随机抽样

  • 随机抽样使用rand()函数确保随机获取数据,LIMIT来限制抽取的数据个数。
  • 表数据多时抽样速度不快,但随机。
  • 有两种用法:
    方法一:(效率较高)
SELECT * FROM student
DISTRIBUTE BY RAND() SORT BY RAND() LIMIT 2;

方法二:

SELECT * FROM student
ORDER BY RAND() LIMIT 2;

Block 基于数据块抽样

  • 允许随机获取n行数据、百分比数据、指定大小的数据
  • 采样粒度是HDFS块大小
  • 优点是速度快,但不随机
  • 例:
  1. 获取1行数据:
SELECT * FROM student
TABLESAMPLE(1 ROWS);
  1. 百分比数据:
SELECT * FROM student
TABLESAMPLE(50 PERCENT);
  1. 指定大小的数据:
SELECT * FROM student
TABLESAMPLE(1k);

Bucket table 基于分桶表抽样

  • 一种特殊的采样方法,针对分桶表进行了优化
  • 抽样既随机,速度也很快。

语法

  • y必须是table总桶数的倍数或因子。hive根据y的大小,决定抽样的比例。(当y=2,有4个桶时,抽取4/2个桶的数据)
  • x表示从哪个桶开始抽取。
  • x的值必须小于y的值。
  • ON colname表示基于什么抽
    1. ON RAND():表示随机抽
    2. ON 分桶字段:表示基于分桶字段抽样,效率更高
TABLESAMPLE (BUCKET x OUT OF y [ON colname])
  • 例:
SELECT * FROM t_usa_covid19_bucket TABLESAMPLE(BUCKET 1 OUT OF 5 ON RAND());
http://www.mnyf.cn/news/387.html

相关文章:

  • 网站调用flash2023新闻热点摘抄
  • 万网网站备案流程如何获取永久免费域名
  • 湖北建设厅考试网站seo小白入门教学
  • 网站建设哈尔滨网站设计3seo中国
  • 高端网站建设行业seo问答
  • 商业网站域名后缀手机搭建网站
  • 中小型企业查询网站企业网站模板设计
  • 深圳做网站网络营销公司排名办公软件速成培训班
  • 做网站用的腾讯云服务器免费b站推广网站不
  • 国外做黄漫的网站网站运营工作内容
  • 网站建立的可以免费发广告的网站
  • 程序员自己做项目的网站google搜索引擎优化
  • 南京 推广 网站建设万网域名管理平台
  • 网站开发公司兴田德润在那里北京网站seo优化推广
  • 武汉手机网站建设如何拼多多代运营一般多少钱
  • 吉林手机版建站系统信息优化网站哪个好
  • jsp网站怎么运行seo新人怎么发外链
  • 大众点评如何做团购网站五行seo博客
  • 玉环建设局网站山西太原网络推广
  • cms网站群湖南竞价优化哪家好
  • 网页制作与网站建设广州运营培训班有用吗
  • 开远市住房和城乡建设局网站优化关键词的公司
  • 做网站教程 第一课b2b和b2c是什么意思
  • 陕西省人民政府官网长沙seo排名优化公司
  • 广州网站建设公司太原百度快速排名提升
  • 在山东省建设监理协会网站seo中国官网
  • 那个视频网站做公开课比较好百度帐号登录个人中心
  • 什么是整合营销并举例说明seo分析
  • 网站的图片水印怎么做营销网站建设多少钱
  • 六安政务中心网站网站alexa排名查询