导航:首页 > 数据分析 > 神经网络分析数据需要多少组数据

神经网络分析数据需要多少组数据

发布时间:2023-06-09 11:58:37

Ⅰ 神经网络对输入变量个数有没有要求,六十个可以吗

可以,但是网络规模太大,很臃肿,需要调整的参数过多,影响收敛速度。

关于隐层节点数:在BP 网络中,隐层节点数的选择非常重要,它不仅对建立的神经网络模型的性能影响很大,而且是训练时出现“过拟合”的直接原因,但是目前理论上还没有一种科学的和普遍的确定方法。 目前多数文献中提出的确定隐层节点数的计算公式都是针对训练样本任意多的情况,而且多数是针对最不利的情况,一般工程实践中很难满足,不宜采用。事实上,各种计算公式得到的隐层节点数有时相差几倍甚至上百倍。为尽可能避免训练时出现“过拟合”现象,保证足够高的网络性能和泛化能力,确定隐层节点数的最基本原则是:在满足精度要求的前提下取尽可能紧凑的结构,即取尽可能少的隐层节点数。研究表明,隐层节点数不仅与输入/输出层的节点数有关,更与需解决的问题的复杂程度和转换函数的型式以及样本数据的特性等因素有关。
在确定隐层节点数时必须满足下列条件:
(1)隐层节点数必须小于N-1(其中N为训练样本数),否则,网络模型的系统误差与训练样本的特性无关而趋于零,即建立的网络模型没有泛化能力,也没有任何实用价值。同理可推得:输入层的节点数(变量数)必须小于N-1。
(2) 训练样本数必须多于网络模型的连接权数,一般为2~10倍,否则,样本必须分成几部分并采用“轮流训练”的方法才可能得到可靠的神经网络模型。
总之,若隐层节点数太少,网络可能根本不能训练或网络性能很差;若隐层节点数太多,虽然可使网络的系统误差减小,但一方面使网络训练时间延长,另一方面,训练容易陷入局部极小点而得不到最优点,也是训练时出现“过拟合”的内在原因。因此,合理隐层节点数应在综合考虑网络结构复杂程度和误差大小的情况下用节点删除法和扩张法确定。

Ⅱ 用MATLAB与BP神经网络法处理15组数据,共60个数据,需要多长时间

训练时长取决于复训练算制法、训练目标、样本数量和网络规模。你的样本只有15组,数量较少,一般几秒钟就能训练完成。

若从速度的角度出发,人脑神经元之间传递信息的速度要远低于计算机,前者为毫秒量级,而后者的频率往往可达几百兆赫。但是,由于人脑是一个大规模并行与串行组合处理系统,因而,在许多问题上可以作出快速判断、决策和处理,其速度则远高于串行结构的普通计算机。人工神经网络的基本结构模仿人脑,具有并行处理特征,可以大大提高工作速度。

Ⅲ 神经网络的数据量多少比较合适

一般来说要1万以上,越多越好,但要保证采集标准统一,且输出为相同的数据不能太多。

Ⅳ matlab神经网络训练一般需要多少数据

你这个问题真的不好回答,因为没有固定答案,也没有什么经验答案,不能太少也不能太多,因为需要根据实际情况决定了,看你是要做什么了

Ⅳ 神经网络,训练样本500条,为什么比训练样本6000条,训练完,500条预测比6000条样本好!

并非训练样本越多越好,因课题而异。 1、样本最关键在于正确性和准确性。你所选择的样本首先要能正确反映该系统过程的内在规律。我们从生产现场采得的样本数据中有不少可能是坏样本,这样的样本会干扰你的神经网络训练。通常我们认为坏样本只是个别现象,所以我们希望通过尽可能大的样本规模来抵抗坏样本造成的负面影响。 2、其次是样本数据分布的均衡性。你所选择的样本最好能涉及到该系统过程可能发生的各种情况,这样可以极大可能的照顾到系统在各个情况下的规律特征。通常我们对系统的内在规律不是很了解,所以我们希望通过尽可能大的样本规模来“地毯式”覆盖对象系统的方方面面。 3、再次就是样本数据的规模,也就是你要问的问题。在确保样本数据质量和分布均衡的情况下,样本数据的规模决定你神经网络训练结果的精度。样本数据量越大,精度越高。由于样本规模直接影响计算机的运算时间,所以在精度符合要求的情况下,我们不需要过多的样本数据,否则我们要等待很久的训练时间。 补充说明一下,不论是径向基(rbf)神经网络还是经典的bp神经网络,都只是具体的训练方法,对于足够多次的迭代,训练结果的准确度是趋于一致的,方法只影响计算的收敛速度(运算时间),和样本规模没有直接关系。

如何确定何时训练集的大小是“足够大”的?
神经网络的泛化能力主要取决于3个因素:
1.训练集的大小
2.网络的架构
3.问题的复杂程度
一旦网络的架构确定了以后,泛化能力取决于是否有充足的训练集。合适的训练样本数量可以使用Widrow的拇指规则来估计。 拇指规则指出,为了得到一个较好的泛化能力,我们需要满足以下条件(Widrow and Stearns,1985;Haykin,2008): N = nw / e 其中,N为训练样本数量,nw是网络中突触权重的数量,e是测试允许的网络误差。 因此,假如我们允许10%的误差,我们需要的训练样本的数量大约是网络中权重数量的10倍。

Ⅵ 人工神经网络分析需要样本量一般多大

1.样本量的确定是费用与精度的函数,取决于研究的精度和费用,特别是实践中费用考虑的更多!
2.抽样调查,特别是随机抽样,样本有代表性,往往比普查更有效率,甚至精度更高,这里我们主要计算和讨论抽样误差,非抽样误差是人为因素,考质量控制;
3.样本量的确定有赖于随机抽样,或者说主要是针对随机抽样,需要统计推断下的计算样本量,如果是非概率抽样,理论上没有计算和控制样本量的问题;
4.如果研究只要40-50个样本,感觉上应该是非概率抽样(依赖被访者选择方式)
5.即使是非概率抽样,我们很多时候也采用概率和统计分析及推断思想来进行数据分析和下结论!只是这种方法没有完善的理论支持,或者说有可能因为研究者的主观判断失误造成偏差;
6.无论是概率抽样还是非概率抽样,样本量越大当然效果越好,结论越稳定(理论上说)
7.40-50个样本在统计上属于小样本,t-检验,如果样本大于60或理想120以上,t分布就是正态分布了,所以40个样本在统计上是最小推断总体的样本,换句话说40-50个样本是介于小样本和正态分布大样本的临界样本量;如果不严格的话40个样本就可以比较总体之间的统计差异了;
8.所以,一般来讲,针对一个研究对象和人群,要进行比较最少40个样本,比如男女差异,应该各拥有40人(80人),或者说你们进行配额样本的时候要保证统计比较的类别至少有40个样本;
9.那么40个样本有代表性吗? 当然越多越好,越有代表性
10.但如果调查对象非常一致,没有差异,只要问一个人就行了,所以要考虑研究对象的差异性,如果差异大,当然样本量要大,如果没有差异,同质性较高样本量就少;
11.总体的大小对样本量的选择没有影响,调查研究一般必须在研究前明确总体是谁,大总体没有影响(上万人),中等总体有点影响(5000人),小总体有很大影响(千百个人);总体是你要推断的人群;
12.再者要考虑研究对象在总体中拥有的比例(比如要找艾滋病人),如果比例非常低的话,需要大样本才能找到;但往往商业研究就采用非概率抽样了,比如滚雪球抽样,专家判断抽样,配额抽样等;
13.另外,选择40个人,如果是经过我们主观判断的,有一种说法:叫条件概率,也就是我们越了解研究目的和对象,我们就越能够做出正确判断;比如P(A|B),也就是说我们越了解B事件发生的概率,那么A发生的概率就越确定;就像我们在Google中搜东西,你的关键词=B越准确,得到的结果A就越是你想要的东西;
14.当然,如果你的主观判断错了,就会犯更大的错误
15.还有就是希望得到的精度;如果得到的结果是70%加减10%误差我们可以接受,但如果是总体本身就不到8%,那8%加减10%,尾巴比头都大显然不行,当然到底如何确定精度,是研究前你们与客户要明确的,事先研究设计确定的,不能事后来说;
16.记住:有时候我们研究本身不需要那么高的精度
17.整个研究设计过程的质量控制可以更有效提升研究品质
18.研究测试的技术(接近自然科学仪器测量)可获得更好研究品质
19.根据精确的抽样,需要采用精确的统计分析,否则也达不到效果
20.任何研究都不会完美,都是权衡和保守的过程,总的来讲保守不犯错
21.如果研究有实验设计和研究设计,所以实验设计,包括所谓双盲实验、正交设计、拉丁方格等,确定样本分组是非常精细的,有助于研究品质;但设计缺陷会造成降低品质;
22.处置组和对照组的设计,主要应用在传播效果、广告效果研究上,需要有设计原则
23.实验设计也强调对其它影响因素的控制,也就是X对Y的影响,要控制住Z的干扰,更能提高研究品质
24.被访者的参与度(你的激励方式)也重要,一分钱一分货;我们是花钱买信息
25.任何理由都是可解释的,但这里主要是要用术语,越专业越说行话,别人更相信,所以解释样本量的科学性,有时候要用科学,也就是理论;
26.因为有理论,显得有水平,因为有水平就有话语权,就有执行力!所以权威部门的设计或出面,客户就相信了!
27.研究过程,不断修正,比如追加样本也是解决问题的办法
28.连续性研究,也会解决或减少对样本量的需求
29.广告效果研究经常采用rolling data的方式,因为广告效果有延迟效应,每周50个样本,4周一个分析,就是200样本,第五周分析前4周,第六周分析2-5周数据,进行比较和检验,这是常有方法;

Ⅶ 神经网络模型需要多少条数据

输入指标是什么意思。输入维数吗?数据一是这些数据有意义是一类的,或者说是有内部规律。数量上多一点好一点。训练样本个预测样本2比1左右就好。学习过程要注意的是你的学习速率,这影响最优解的寻找。

阅读全文

与神经网络分析数据需要多少组数据相关的资料

热点内容
列表文件存储路径 浏览:540
qq游戏大厅自动出语音 浏览:598
编程只是兴趣怎么办 浏览:223
荣耀6plus电信版本 浏览:584
能打开word文件但桌面上找不到 浏览:366
2020十大网络红歌有哪些 浏览:843
手机系统空间文件夹在哪里设置快捷键 浏览:309
通信网络中的b8什么意思 浏览:715
桌面文件标题 浏览:228
优淘集市有什么app 浏览:747
找不到收藏文件 浏览:711
战狼2在什么网站 浏览:785
vb修改word 浏览:650
c盘分页文件 浏览:277
ipad如何互相传输数据 浏览:567
我的世界如何用积木编程大师复制方块 浏览:638
进网站请求路径未找到是怎么回事 浏览:807
spss21教程 浏览:655
css商业网站布局之道pdf 浏览:892
c盘不能新建文件夹win10 浏览:384

友情链接