導航:首頁 > 數據分析 > 為什麼數據分組不用整數

為什麼數據分組不用整數

發布時間:2023-02-17 15:51:23

『壹』 問題:頻率分布表中的分組數據,為什麼用小數

因為「分布表」表示的是當總體為「1」的時候,各頻段出現在總體「1」中所佔份額,所以不可能大於1。

『貳』 數值型數據的分組方法有哪些簡述組距分組的步驟

數值型數據的分組方法有單變數值分組和組距分組;

組距分組的步驟如下:

  1. 第一步:確定組距,一般情況下,分組數據不應少於5組且不多於15組;

  2. 第二步:確定各組的組距,第一組的下限應低於最小變數,最後一組的上限應高於最大變數值;

  3. 第三步:根據分組整理成頻數分布表。

數值型數據介紹:

  1. 數值型數據是表示數量、可以進行數值運算的數據類型。數值型數據由數字、小數點、正負號和表示乘冪的字母E組成,數值精度達16位。在VF系統中,按存儲、表示形式與取值范圍不同,數值型數據又分為4種不同類型。

  2. 數值型(Numeric)數據由數字、小數點、正負號和字母E組成,用字母N表示。數值型數據的取值范圍是:-0.9999999999E+19+到0.9999999999E+20,包括正負號、小數點和字母E在內,其長度最大20位。通常用於表示實數。

  3. 浮點型(FLOAT)數據是數值型數據的一種,用字母F表示。它與數值型數據完全等價,只是在存儲形式上用浮點格式,主要是為了得到較高的計算精度。

  4. 雙精度型(DOUBLE)數據是具有更高精度的一種數據型數據,用字母B表示。它採用固定長充浮點格式存儲,佔用8個位元組。

  5. 整型(INTEGER)數據是不包含小數部分的數值型數據,用字母I表示。整型數據只用來表示整數,以二進制形式存儲,佔用4個位元組。

『叄』 如何確定「組距」和「組數」

1、組數和組距只能確定一個,沒有限制,只要一個定了下來,另一個也就相應的可以按照書上的公式算出來。

組數(通常組數在5-12之間), 用組距去除最大值和最小值之差,求出組數,需要再確定一下組距是否合適, 以保證使數據不落在相鄰兩組的邊界值上,造成統計的錯誤。

2、組距5至12都可以;組數為8。

(最大值-最小值)÷組距=組數所以,(99-60)÷5=七又五分之四(也就是八),所以組數是8。

最大值減最小值除以組距的商的范圍一定要在5至12組之間。

(3)為什麼數據分組不用整數擴展閱讀

組距分組的原則

採用組距分組時,需要遵循「不重不漏」的原則。「不重」是指一項數據只能分在其中的某一組,不能在其他組中重復出現;「不漏」是指組別能夠窮盡,即在所分的全部組別中每項數據都能分在其中的某一組,不能遺漏。

為解決「不重」的問題,統計分組時習慣上規定「上組限不在內」,即當相鄰兩組的上下限重疊時,恰好等於某一組上限的變數值不算在本組內,而計算在下一組內。

組距不一定是整數,但通常情況下為了分組的方便而取整數。組數一定是整數。

『肆』 數值型數據的分組方法有哪些簡述組距分組的步驟

數值型數據的分組方法主要有兩種,分別是單變數值分組、組距分組。

組距分組的步驟:

1、確定組數。一組數據的組數一般與數據本身的特點及數據的多少有關。由於分組的目的之一是為了觀察數據分布的特徵,因此組數的多少應適中。如組數太少,數據的分布就會過於集中,組數太多,數據的分布就會過於分散,這都不便於觀察數據分布的特徵和規律。組數的確定應以能夠顯示數據的分布特徵和規律為目的。

2、確定各組的組距。組距是一個組的上限與下限的差,可根據全部數據的最大值和最小值(即極差)及所分的組數來確定,即組距=(最大值-最小值)/組數。

3、根據分組整理成頻數分布表。

(4)為什麼數據分組不用整數擴展閱讀:

採用組距分組時,需要遵循「不重不漏」的原則。「不重」是指一項數據只能分在其中的某一組,不能在其他組中重復出現;「不漏」是指組別能夠窮盡,即在所分的全部組別中每項數據都能分在其中的某一組,不能遺漏。

在組距分組中,如果全部數據中的最大值和最小值與其他數據相差懸殊,為避免出現空白組(即沒有變數值的組)或個別極端值被漏掉,第一組和最後一組可以採取「××以下」及「××以上」這樣的開口組。

『伍』 數據分組

對一批觀測數據進行整理,為了運算方便,往往要將數據按照一定要求分組。特別是在數據較多時分組計算的優越性尤為明顯。數據分組之後也便於制圖,如頻數(數據落在每個組的數目稱頻數)分布直方圖、頻率(頻數/總頻數)直方圖、累積頻率(樣本分組數據中各組頻率累積之和)分布圖等。下面以228個伽馬數據為例,具體說明分組、列表、制圖的方法。

(一)分組

將觀測數據劃分多少組,要根據數據的多少、數據的性質、數據的變化范圍、觀測質量等來適當劃分。一般不宜少於5組,也不必多於15組或20組。一組中的最小值叫組下限,一組中的最大值叫組上限。分組時前一組的組上限,又是後一組的組下限。組上限與組下限之差叫組距;分組一般用等間距,組距記為L。各組中的中點數值為組中值。有些觀測數據,如微量元素的含量等,往往要將元素含量取常用對數(微量元素含量不服從正態分布,而服從對數正態分布),然後將對數值按等差的方法分組。

分組具體步驟如下:

1.確定數據上界和下界

上界可比數據中最大值稍大一點,下界可比數據中最小值稍小一點。在對某花崗岩的γ測量中共有228個數據,最小值為18γ,最大值為51γ,那麼下界可定為17γ,上界可定為53γ。

2.決定組距和組數

組距決定於極差R(上界-下界),此例中R=53γ-17γ=36γ,組距可定為4γ,分成9組。假定用n代表分組數,l為組距,計算公式如下:

放射性勘探技術

3.決定分組點

一般要求分組點比原觀測精度高一位,使分組嚴密,避免一個數據可分在上一個組也可分在下一個組,由於值都是整數,於是取n.5為組限。將數據可分為如下9組:17.5~21.5,21.5~25.5,…,49.5~53.5。

4.統計頻數

用選舉唱票的方法計算出落在每個組的數目,即頻數,並計算出頻率與累積頻率。

(二)列表

將統計結果列成表,如表8-1所示。

表8-1 某礦區伽馬測量資料統計表

(三)制圖

主要是繪制頻數(或頻率)分布直方圖和累積頻率折線圖。

1.繪制頻數(頻率)分布直方圖

在橫坐標上標出分組點,縱坐標為對應的頻數(頻率),以組距為底畫出高度為頻數(頻率)的矩形,便得頻數(頻率)直方圖,如圖8-1所示。

圖8-1 某區伽馬測量頻數直方圖和頻率曲線圖

2.繪制累計頻率折線圖

仍以橫坐標標出分組點,縱坐標為累積頻率f值(%)。在各組組上限處立一高為相對應的累積頻率的虛線段,依次聯結各虛線段的頂點,就構成了累積頻率曲線圖,如圖8-2所示。

可以設想,如果取更多的樣本,組分得更細,那麼各樣本值或者各組頻率將趨於一個穩定的值。且由於組距L不斷減小以至趨近於零,頻率直方圖的形狀將逐漸趨近於一條曲線。換句話說,頻率分布的極限,可以考慮一個穩定的函數。當樣本值是連續變數(可以取一個或幾個區間中,甚至整個數軸上一切數值的變數,叫連續變數,如某岩體的γ輻射照射量率)的情形,這個函數y=f(x)將表達一條光滑的曲線。這條曲線叫頻率分布曲線。若數據波動的規律不同,頻率分布曲線的形狀也就不一樣。在放射性物探工作中,形狀如圖8-2的曲線最多,應用也最廣,稱為正態分布曲線。

由於頻率之總和(累積頻率)為1(100%)。不難看出,如果縱坐標取為「頻率/組距」,那麼頻率直方圖矩形面積的總和等於1。換句話說,分布曲線y=f(x)與橫軸所夾的面積等於1,顯然可用積分之值來表示。即

放射性勘探技術

圖8-2的縱坐標的含意是,在橫軸的單位長度上平均分布有多少頻率,也就是頻率分布密度。所以由頻率分布曲線所確定的函數y=f(x),叫作頻率分布密度函數。

圖8-2 某區伽馬測量累積頻率曲線圖

閱讀全文

與為什麼數據分組不用整數相關的資料

熱點內容
excel表格插入圖片後文件很大 瀏覽:208
找不到手雷文件夾 瀏覽:26
dnf劇情視頻在哪個文件夾 瀏覽:252
遠程桌面可以復制文件 瀏覽:752
win10星際爭霸聯網嗎 瀏覽:212
windowsgit配置文件 瀏覽:508
c編程跟c編程有什麼區別 瀏覽:119
6M網路怎麼樣 瀏覽:473
word文檔如何另外保存文件 瀏覽:176
creo20國標配置文件下載 瀏覽:172
win10自動散熱 瀏覽:664
xp系統用戶桌面文件交換 瀏覽:858
把蘋果密碼改了怎麼辦 瀏覽:209
護照用微信怎麼繳費 瀏覽:526
matlab生成dll文件 瀏覽:836
小米平板2win10恢復出廠設置 瀏覽:6
東方財富app怎麼增加指標 瀏覽:985
ajax獲取資料庫 瀏覽:855
中國移動adsl上網賬號密碼 瀏覽:198
win10怎麼添加畫圖3d文件 瀏覽:921

友情鏈接