BigData
SparkSQL小题 SparkSQL小题
数据准备创表语句 click_product_id CREATE TABLE `user_visit_action`( `date` string, `user_id` bigint, `session_id` string, `p
2022-04-17
SparkSQL用户自定义函数 SparkSQL用户自定义函数
UDF package com.tzk.sparksql.udf import org.apache.spark.SparkConf import org.apache.spark.sql.SparkSession object UD
2022-04-16
SparkSQL的基础命令 SparkSQL的基础命令
DF,DS,RDD三者转换 val rdd = sc.makeRDD(List(("张三",23),("李四",22))) // RDD => DF val df = rdd.toDF // RDD => DS // 可以直接转,但是工作
2022-04-15
SparkSQL组件的理解 SparkSQL组件的理解
DataFrame他是一种以RDD为基础的分布式数据集,相当于传统数据库的二维表. 但是,他与RDD的主要区别在于,他包含了schema元信息. 即他为数据提供了schema的视图.具体见下图 然后有以下几点需要理解: 他是包含
2022-04-14