導航:首頁 > 數據分析 > 為什麼數據分組不用整數

為什麼數據分組不用整數

發布時間：2023-02-17 15:51:23

『壹』問題:頻率分布表中的分組數據,為什麼用小數

因為「分布表」表示的是當總體為「1」的時候，各頻段出現在總體「1」中所佔份額，所以不可能大於1。

『貳』數值型數據的分組方法有哪些簡述組距分組的步驟

數值型數據的分組方法有單變數值分組和組距分組；

組距分組的步驟如下：

第一步：確定組距，一般情況下，分組數據不應少於5組且不多於15組；
第二步：確定各組的組距，第一組的下限應低於最小變數，最後一組的上限應高於最大變數值；
第三步：根據分組整理成頻數分布表。

數值型數據介紹：

數值型數據是表示數量、可以進行數值運算的數據類型。數值型數據由數字、小數點、正負號和表示乘冪的字母E組成，數值精度達16位。在VF系統中，按存儲、表示形式與取值范圍不同，數值型數據又分為4種不同類型。
數值型（Numeric）數據由數字、小數點、正負號和字母E組成，用字母N表示。數值型數據的取值范圍是：-0.9999999999E+19+到0.9999999999E+20，包括正負號、小數點和字母E在內，其長度最大20位。通常用於表示實數。
浮點型（FLOAT）數據是數值型數據的一種，用字母F表示。它與數值型數據完全等價，只是在存儲形式上用浮點格式，主要是為了得到較高的計算精度。
雙精度型（DOUBLE）數據是具有更高精度的一種數據型數據，用字母B表示。它採用固定長充浮點格式存儲，佔用8個位元組。
整型（INTEGER）數據是不包含小數部分的數值型數據，用字母I表示。整型數據只用來表示整數，以二進制形式存儲，佔用4個位元組。

『叄』如何確定「組距」和「組數」

1、組數和組距只能確定一個，沒有限制，只要一個定了下來，另一個也就相應的可以按照書上的公式算出來。

組數（通常組數在5－12之間）, 用組距去除最大值和最小值之差,求出組數，需要再確定一下組距是否合適, 以保證使數據不落在相鄰兩組的邊界值上,造成統計的錯誤。

2、組距5至12都可以；組數為8。

（最大值-最小值）÷組距=組數所以，（99-60）÷5=七又五分之四（也就是八），所以組數是8。

最大值減最小值除以組距的商的范圍一定要在5至12組之間。

(3)為什麼數據分組不用整數擴展閱讀

組距分組的原則

採用組距分組時，需要遵循「不重不漏」的原則。「不重」是指一項數據只能分在其中的某一組，不能在其他組中重復出現；「不漏」是指組別能夠窮盡，即在所分的全部組別中每項數據都能分在其中的某一組，不能遺漏。

為解決「不重」的問題，統計分組時習慣上規定「上組限不在內」，即當相鄰兩組的上下限重疊時，恰好等於某一組上限的變數值不算在本組內，而計算在下一組內。

組距不一定是整數，但通常情況下為了分組的方便而取整數。組數一定是整數。

『肆』數值型數據的分組方法有哪些簡述組距分組的步驟

數值型數據的分組方法主要有兩種，分別是單變數值分組、組距分組。

組距分組的步驟：

1、確定組數。一組數據的組數一般與數據本身的特點及數據的多少有關。由於分組的目的之一是為了觀察數據分布的特徵，因此組數的多少應適中。如組數太少，數據的分布就會過於集中，組數太多，數據的分布就會過於分散，這都不便於觀察數據分布的特徵和規律。組數的確定應以能夠顯示數據的分布特徵和規律為目的。

2、確定各組的組距。組距是一個組的上限與下限的差，可根據全部數據的最大值和最小值（即極差）及所分的組數來確定，即組距=（最大值－最小值）/組數。

3、根據分組整理成頻數分布表。

(4)為什麼數據分組不用整數擴展閱讀：

在組距分組中，如果全部數據中的最大值和最小值與其他數據相差懸殊，為避免出現空白組（即沒有變數值的組）或個別極端值被漏掉，第一組和最後一組可以採取「××以下」及「××以上」這樣的開口組。

『伍』數據分組

對一批觀測數據進行整理,為了運算方便,往往要將數據按照一定要求分組。特別是在數據較多時分組計算的優越性尤為明顯。數據分組之後也便於制圖,如頻數(數據落在每個組的數目稱頻數)分布直方圖、頻率(頻數/總頻數)直方圖、累積頻率(樣本分組數據中各組頻率累積之和)分布圖等。下面以228個伽馬數據為例,具體說明分組、列表、制圖的方法。

(一)分組

將觀測數據劃分多少組,要根據數據的多少、數據的性質、數據的變化范圍、觀測質量等來適當劃分。一般不宜少於5組,也不必多於15組或20組。一組中的最小值叫組下限,一組中的最大值叫組上限。分組時前一組的組上限,又是後一組的組下限。組上限與組下限之差叫組距；分組一般用等間距,組距記為L。各組中的中點數值為組中值。有些觀測數據,如微量元素的含量等,往往要將元素含量取常用對數(微量元素含量不服從正態分布,而服從對數正態分布),然後將對數值按等差的方法分組。

分組具體步驟如下：

1.確定數據上界和下界

上界可比數據中最大值稍大一點,下界可比數據中最小值稍小一點。在對某花崗岩的γ測量中共有228個數據,最小值為18γ,最大值為51γ,那麼下界可定為17γ,上界可定為53γ。

2.決定組距和組數

組距決定於極差R(上界－下界),此例中R=53γ－17γ=36γ,組距可定為4γ,分成9組。假定用n代表分組數,l為組距,計算公式如下：

放射性勘探技術

3.決定分組點

一般要求分組點比原觀測精度高一位,使分組嚴密,避免一個數據可分在上一個組也可分在下一個組,由於值都是整數,於是取n.5為組限。將數據可分為如下9組：17.5～21.5,21.5～25.5,…,49.5～53.5。

4.統計頻數

用選舉唱票的方法計算出落在每個組的數目,即頻數,並計算出頻率與累積頻率。

(二)列表

將統計結果列成表,如表8-1所示。

表8-1 某礦區伽馬測量資料統計表

(三)制圖

主要是繪制頻數(或頻率)分布直方圖和累積頻率折線圖。

1.繪制頻數(頻率)分布直方圖

在橫坐標上標出分組點,縱坐標為對應的頻數(頻率),以組距為底畫出高度為頻數(頻率)的矩形,便得頻數(頻率)直方圖,如圖8-1所示。

圖8-1 某區伽馬測量頻數直方圖和頻率曲線圖

2.繪制累計頻率折線圖

仍以橫坐標標出分組點,縱坐標為累積頻率f值(%)。在各組組上限處立一高為相對應的累積頻率的虛線段,依次聯結各虛線段的頂點,就構成了累積頻率曲線圖,如圖8-2所示。

可以設想,如果取更多的樣本,組分得更細,那麼各樣本值或者各組頻率將趨於一個穩定的值。且由於組距L不斷減小以至趨近於零,頻率直方圖的形狀將逐漸趨近於一條曲線。換句話說,頻率分布的極限,可以考慮一個穩定的函數。當樣本值是連續變數(可以取一個或幾個區間中,甚至整個數軸上一切數值的變數,叫連續變數,如某岩體的γ輻射照射量率)的情形,這個函數y=f(x)將表達一條光滑的曲線。這條曲線叫頻率分布曲線。若數據波動的規律不同,頻率分布曲線的形狀也就不一樣。在放射性物探工作中,形狀如圖8-2的曲線最多,應用也最廣,稱為正態分布曲線。

由於頻率之總和(累積頻率)為1(100%)。不難看出,如果縱坐標取為「頻率/組距」,那麼頻率直方圖矩形面積的總和等於1。換句話說,分布曲線y=f(x)與橫軸所夾的面積等於1,顯然可用積分之值來表示。即

放射性勘探技術

圖8-2的縱坐標的含意是,在橫軸的單位長度上平均分布有多少頻率,也就是頻率分布密度。所以由頻率分布曲線所確定的函數y=f(x),叫作頻率分布密度函數。

圖8-2 某區伽馬測量累積頻率曲線圖

閱讀全文

與為什麼數據分組不用整數相關的資料

熱點內容

網路中常用的傳輸介質發布：2025-10-20 08:42:23 瀏覽：518

文件如何使用發布：2025-10-20 08:33:27 瀏覽：322

同步推密碼找回發布：2025-10-20 08:04:22 瀏覽：865

樂高怎麼才能用電腦編程序發布：2025-10-20 07:57:56 瀏覽：65

本機qq文件為什麼找不到發布：2025-10-20 07:39:47 瀏覽：264

安卓qq空間免升級發布：2025-10-20 07:36:50 瀏覽：490

linux如何刪除模塊驅動程序發布：2025-10-20 07:36:06 瀏覽：193

at89c51c程序發布：2025-10-20 07:35:06 瀏覽：329

怎麼創建word大綱文件發布：2025-10-20 07:24:54 瀏覽：622

裊裊朗誦文件生成器發布：2025-10-20 07:00:55 瀏覽：626

1054件文件是多少gb 發布：2025-10-20 06:03:27 瀏覽：371

高州禁養區內能養豬多少頭的文件發布：2025-10-20 05:51:26 瀏覽：927

win8ico文件發布：2025-10-20 05:47:08 瀏覽：949

仁和數控怎麼編程發布：2025-10-20 05:24:49 瀏覽：381

項目文件夾圖片發布：2025-10-20 04:42:54 瀏覽：87

怎麼在東芝電視安裝app 發布：2025-10-20 04:42:54 瀏覽：954

plc顯示數字怎麼編程發布：2025-10-20 04:42:54 瀏覽：439

如何辨別假網站發布：2025-10-20 04:26:28 瀏覽：711

寬頻用別人的賬號密碼發布：2025-10-20 04:08:00 瀏覽：556

新app如何佔有市場發布：2025-10-20 03:39:57 瀏覽：42

導航:首頁 > 數據分析 > 為什麼數據分組不用整數

為什麼數據分組不用整數

與為什麼數據分組不用整數相關的資料

友情鏈接