【学习笔记】高等数据基础

小咪咪 2022-09-06 04:49 120阅读 0赞

一、数学概况

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3pob25nZ3VvbWFv_size_16_color_FFFFFF_t_70

二、数据类型

【分类1】

离散型数据 : 比如骰子,无论怎么掷,概率都是1/6。

离散随机变量是指一个只取有限个数或可数无限个数值的随机变量。

通常用古典概型来描述。

连续型数据 :比如 时间/长度/面积 ,概览都是1/∞=0。

连续随机变量是指一个取任何实数的概率都为零的变量。

通常用几何概型来描述。

【分类2】

横截面数据:某个时间点/时间段内取到的数据,比如商业领域数据,是处理方法最全面最完善的数据。有各种各样的模型来处理横截面数据,比如回归模型,神经网络,决策树等。

时间序列数据:比如金融领域数据,例如股票,随着时间的改变,股票的市值呈现折线图,其自带因果性,过去的数据或多或少会影响未来。

面板数据:既有时间属性又有空间属性,比如去年一年所有省市自治区的销售数据,该类企业很少处理使用。

【分类3】

定类尺度:比如国籍/男女,不可排序,不可运算,因为中国不可能大于美国,中国也不可以加减美国。

定序尺度:比如健康状况,可以排序,不可运算,比如健康可依次分为优良差,但不可以优加减良。

定距尺度:数值型数据,可以排序,可以运算,比如年份,0点是有意义的,公元零年。

定比尺度:数值型数据,可以排序,可以运算,比如体重,0点是没有意义的,0体重不存在。

watermark_type_ZmFuZ3poZW5naGVpdGk_shadow_10_text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3pob25nZ3VvbWFv_size_16_color_FFFFFF_t_70 1

最后,注意不同类型数据要用不同数据类型去处理。

013c0a3c4921da359750bd6813902108.png

发表评论

表情:
评论列表 (有 0 条评论,120人围观)

还没有评论,来说两句吧...

相关阅读

    相关 高等数学基础07:梯度

    > 梯度的本意是一个向量(矢量),表示某一函数在该点处的方向导数沿着该方向取得最大值,即函数在该点处沿着该方向(此梯度的方向)变化最快,变化率最大(为该梯度的模)。 梯度