『壹』 問題:頻率分布表中的分組數據,為什麼用小數
因為「分布表」表示的是當總體為「1」的時候,各頻段出現在總體「1」中所佔份額,所以不可能大於1。
『貳』 數值型數據的分組方法有哪些簡述組距分組的步驟
數值型數據的分組方法有單變數值分組和組距分組;
組距分組的步驟如下:
第一步:確定組距,一般情況下,分組數據不應少於5組且不多於15組;
第二步:確定各組的組距,第一組的下限應低於最小變數,最後一組的上限應高於最大變數值;
第三步:根據分組整理成頻數分布表。
數值型數據介紹:
數值型數據是表示數量、可以進行數值運算的數據類型。數值型數據由數字、小數點、正負號和表示乘冪的字母E組成,數值精度達16位。在VF系統中,按存儲、表示形式與取值范圍不同,數值型數據又分為4種不同類型。
數值型(Numeric)數據由數字、小數點、正負號和字母E組成,用字母N表示。數值型數據的取值范圍是:-0.9999999999E+19+到0.9999999999E+20,包括正負號、小數點和字母E在內,其長度最大20位。通常用於表示實數。
浮點型(FLOAT)數據是數值型數據的一種,用字母F表示。它與數值型數據完全等價,只是在存儲形式上用浮點格式,主要是為了得到較高的計算精度。
雙精度型(DOUBLE)數據是具有更高精度的一種數據型數據,用字母B表示。它採用固定長充浮點格式存儲,佔用8個位元組。
整型(INTEGER)數據是不包含小數部分的數值型數據,用字母I表示。整型數據只用來表示整數,以二進制形式存儲,佔用4個位元組。
『叄』 如何確定「組距」和「組數」
1、組數和組距只能確定一個,沒有限制,只要一個定了下來,另一個也就相應的可以按照書上的公式算出來。
組數(通常組數在5-12之間), 用組距去除最大值和最小值之差,求出組數,需要再確定一下組距是否合適, 以保證使數據不落在相鄰兩組的邊界值上,造成統計的錯誤。
2、組距5至12都可以;組數為8。
(最大值-最小值)÷組距=組數所以,(99-60)÷5=七又五分之四(也就是八),所以組數是8。
最大值減最小值除以組距的商的范圍一定要在5至12組之間。
(3)為什麼數據分組不用整數擴展閱讀
組距分組的原則
採用組距分組時,需要遵循「不重不漏」的原則。「不重」是指一項數據只能分在其中的某一組,不能在其他組中重復出現;「不漏」是指組別能夠窮盡,即在所分的全部組別中每項數據都能分在其中的某一組,不能遺漏。
為解決「不重」的問題,統計分組時習慣上規定「上組限不在內」,即當相鄰兩組的上下限重疊時,恰好等於某一組上限的變數值不算在本組內,而計算在下一組內。
組距不一定是整數,但通常情況下為了分組的方便而取整數。組數一定是整數。
『肆』 數值型數據的分組方法有哪些簡述組距分組的步驟
數值型數據的分組方法主要有兩種,分別是單變數值分組、組距分組。
組距分組的步驟:
1、確定組數。一組數據的組數一般與數據本身的特點及數據的多少有關。由於分組的目的之一是為了觀察數據分布的特徵,因此組數的多少應適中。如組數太少,數據的分布就會過於集中,組數太多,數據的分布就會過於分散,這都不便於觀察數據分布的特徵和規律。組數的確定應以能夠顯示數據的分布特徵和規律為目的。
2、確定各組的組距。組距是一個組的上限與下限的差,可根據全部數據的最大值和最小值(即極差)及所分的組數來確定,即組距=(最大值-最小值)/組數。
3、根據分組整理成頻數分布表。
(4)為什麼數據分組不用整數擴展閱讀:
採用組距分組時,需要遵循「不重不漏」的原則。「不重」是指一項數據只能分在其中的某一組,不能在其他組中重復出現;「不漏」是指組別能夠窮盡,即在所分的全部組別中每項數據都能分在其中的某一組,不能遺漏。
在組距分組中,如果全部數據中的最大值和最小值與其他數據相差懸殊,為避免出現空白組(即沒有變數值的組)或個別極端值被漏掉,第一組和最後一組可以採取「××以下」及「××以上」這樣的開口組。
『伍』 數據分組
對一批觀測數據進行整理,為了運算方便,往往要將數據按照一定要求分組。特別是在數據較多時分組計算的優越性尤為明顯。數據分組之後也便於制圖,如頻數(數據落在每個組的數目稱頻數)分布直方圖、頻率(頻數/總頻數)直方圖、累積頻率(樣本分組數據中各組頻率累積之和)分布圖等。下面以228個伽馬數據為例,具體說明分組、列表、制圖的方法。
(一)分組
將觀測數據劃分多少組,要根據數據的多少、數據的性質、數據的變化范圍、觀測質量等來適當劃分。一般不宜少於5組,也不必多於15組或20組。一組中的最小值叫組下限,一組中的最大值叫組上限。分組時前一組的組上限,又是後一組的組下限。組上限與組下限之差叫組距;分組一般用等間距,組距記為L。各組中的中點數值為組中值。有些觀測數據,如微量元素的含量等,往往要將元素含量取常用對數(微量元素含量不服從正態分布,而服從對數正態分布),然後將對數值按等差的方法分組。
分組具體步驟如下:
1.確定數據上界和下界
上界可比數據中最大值稍大一點,下界可比數據中最小值稍小一點。在對某花崗岩的γ測量中共有228個數據,最小值為18γ,最大值為51γ,那麼下界可定為17γ,上界可定為53γ。
2.決定組距和組數
組距決定於極差R(上界-下界),此例中R=53γ-17γ=36γ,組距可定為4γ,分成9組。假定用n代表分組數,l為組距,計算公式如下:
放射性勘探技術
3.決定分組點
一般要求分組點比原觀測精度高一位,使分組嚴密,避免一個數據可分在上一個組也可分在下一個組,由於值都是整數,於是取n.5為組限。將數據可分為如下9組:17.5~21.5,21.5~25.5,…,49.5~53.5。
4.統計頻數
用選舉唱票的方法計算出落在每個組的數目,即頻數,並計算出頻率與累積頻率。
(二)列表
將統計結果列成表,如表8-1所示。
表8-1 某礦區伽馬測量資料統計表
(三)制圖
主要是繪制頻數(或頻率)分布直方圖和累積頻率折線圖。
1.繪制頻數(頻率)分布直方圖
在橫坐標上標出分組點,縱坐標為對應的頻數(頻率),以組距為底畫出高度為頻數(頻率)的矩形,便得頻數(頻率)直方圖,如圖8-1所示。
圖8-1 某區伽馬測量頻數直方圖和頻率曲線圖
2.繪制累計頻率折線圖
仍以橫坐標標出分組點,縱坐標為累積頻率f值(%)。在各組組上限處立一高為相對應的累積頻率的虛線段,依次聯結各虛線段的頂點,就構成了累積頻率曲線圖,如圖8-2所示。
可以設想,如果取更多的樣本,組分得更細,那麼各樣本值或者各組頻率將趨於一個穩定的值。且由於組距L不斷減小以至趨近於零,頻率直方圖的形狀將逐漸趨近於一條曲線。換句話說,頻率分布的極限,可以考慮一個穩定的函數。當樣本值是連續變數(可以取一個或幾個區間中,甚至整個數軸上一切數值的變數,叫連續變數,如某岩體的γ輻射照射量率)的情形,這個函數y=f(x)將表達一條光滑的曲線。這條曲線叫頻率分布曲線。若數據波動的規律不同,頻率分布曲線的形狀也就不一樣。在放射性物探工作中,形狀如圖8-2的曲線最多,應用也最廣,稱為正態分布曲線。
由於頻率之總和(累積頻率)為1(100%)。不難看出,如果縱坐標取為「頻率/組距」,那麼頻率直方圖矩形面積的總和等於1。換句話說,分布曲線y=f(x)與橫軸所夾的面積等於1,顯然可用積分之值來表示。即
放射性勘探技術
圖8-2的縱坐標的含意是,在橫軸的單位長度上平均分布有多少頻率,也就是頻率分布密度。所以由頻率分布曲線所確定的函數y=f(x),叫作頻率分布密度函數。
圖8-2 某區伽馬測量累積頻率曲線圖