A. 中深层油气藏高精度地震勘探关键技术
随着勘探工作的深入,沙三下、沙四、孔店等中深层成为下步增储上产的重要接替层系,地层岩性组合特点是多为砂泥岩薄互层,具有埋藏深度大、储层单层厚度薄和横向变化快的特点,局部地区含有灰质、白云质成分,地震描述难度大,主要原因在于中深层地震反射能量较弱、信噪比低、成像差、吸收衰减大,难以有效地识别中深层目标,因此,“十一五”期间重点加强了采集、处理过程中提高资料信噪比和成像精度技术的攻关研究,在胜利探区的民丰、五号桩、纯化和中原濮卫文北等地区的应用中取得了一定了效果,提高了中深层资料的成像质量;解释方面主要以沉积背景约束的多属性储层预测为主,形成了针对中深层油气藏勘探的关键技术方法(表4-17)。
表4-17 中深层油气藏高精度地震勘探技术对策表
(一)中深层油气藏地震采集关键技术
1.深层目标的观测系统设计
针对深层反射能量弱、成像效果差的勘探难点,设计反映深层目标地区特征的地质模型,通过照明分析和模型正演分析了解观测系统对各目标层位的照明情况和成像效果,优化观测系统布局和指导炮点加密,设计出“能解决地质问题”的观测系统。
图4-132是炮点加密及最佳接收位置确定前后模拟剖面对比,可以看出经过照明统计分析,实施后剖面成像质量高于实施前成像质量,照明阴影区减小,断层处成像已经有了很大的改善。
图4-133为基于叠前成像的观测系统设计技术流程框图。经过基于叠前偏移成像效果设计的观测系统一般具有炮检点布局均匀、空间连续性好的特点,从而获得较好的叠前偏移效果和均匀的横向照明。
2.高能激发技术
激发是三维地震的重要环节,激发条件选择的目的是增强激发有效波能量,达到勘探深度的要求,激发的地震波频谱要宽,使地震资料有较高的分辨能力;多次激发的重复性要好,确保全区地震记录稳定。激发条件选择重点围绕激发深度、激发岩性、激发药量、激发方式等四大因素。合适的激发深度应避开低速带,避开虚反射的干扰。合适的激发岩性应避开流沙层、松散砂层等弹性不好的岩层;合适的药量应保证深层有一定的信噪比,反射波频谱要宽,避免过大、过小药量出现;合适的激发方式要通过试验确定单点激发还是组合激发,以最大削弱干扰波。
图4-132 炮点加密及最佳接收位置确定前后剖面
图4-133 基于叠前成像的观测系统设计技术流程框图
1)延迟震源激发技术
通过对炸药爆速、震源结构、爆炸方向等影响地震激发效果因素的研究,尤其是对宽频带、高能量、强方向性、低干扰震源的研究,利用药量与激发子波频率成亩此亮反比,以及与激发子波振幅成正比,同时利用爆炸能量的叠加性和爆炸的定向性,开发了延迟叠加震源,利用小药量爆炸产生高频信号的特点和爆炸能量延迟叠加来解决小药量激发能量不足的问题,延时震源的研制与应用能够满足高能、宽频的地震激发要求。优点有:能量定向传播,实现同相叠加;有效压制次生干扰波;提高了主频,增加了频宽。
图4-134a中可见延时震源单炮记录浅中深反射信号扒老能量强,而面波能量明显减弱。另外,多级延时爆炸法不会随着药量增大而使地震波主频和频宽迅速减小;在相同药量情况下,它可提高地震波主频,拓宽地震波频带(图4-134b)。
图4-134a 延时震源与普通震源单炮记录固定增益显示
图4-134b 相同药量两种激发方式记录的深层频谱对比
2)配套激发技术
震源激发参数不合理是引起次生干扰波的一个因素。要压制噪声,需要对激发参数进行优化,主要包括如下四个方面:
(1)优化激发井深。激发井深必须在虚反射界面下一定深度,具体深度应根据要保护的地震波信号确定。如果在虚反射界面以上激发,震源产生的能量传到地表,会引起强大的干扰。
(2)优选药量。药量增大,对提高地震波能量有好处。但当药量达到一定程度后再继续增加药量,转换成地层弹性波的能量变化不大,而大部分能量用来破碎地层。不但没有改进地震资料,反而会迅宽引起更大的次生干扰。
(3)几何耦合。几何耦合就是爆炸物与周围接触的紧密程度。接触的越紧密,也就是几何耦合的程度越好。为了确保较好的几何耦合,一方面井壁内径与药包直径相差不能太大,另一方面可以通过较好的封井技术来实现(图4-135)。因此,野外采用“3次闷井”技术措施,既可防止井喷、减少声波干扰,又能改善几何耦合,确保激发能量的下传。
图4-135 不封井和封井固定增益记录对比
(4)阻抗耦合。阻抗耦合是指炸药和围岩介质之间的耦合关系,爆炸物的特性阻抗与介质特性阻抗的比值称为阻抗耦合。当该比值接近或者等于1时,阻抗耦合最好,激发的反射波能量强、有效频带宽、信噪比高。
(二)中深层油气藏地震资料处理关键技术
1.基于广义S变换的吸收衰减补偿方法
由于中深层目的层有效反射能量相对较弱,因此有效反射能量的恢复与补偿对中深层成像至关重要,能量补偿技术主要包括:球面扩散补偿、地表一致性振幅补偿、剩余振幅补偿、基于广义S变换的吸收衰减补偿、优势频带能量加强等。
根据广义S变换理论,可以将地震道高分辨率地变换为时频平面分布,由于不存在STFT的时窗宽度问题,也不存在WT的尺度宽度问题,因此,无需加平滑窗。
从补偿前后的振幅谱和时频谱(图4-136、图4-137)可以看出基于广义S变换的吸收衰减补偿可以有效地补偿衰减的振幅和高频成分。
2.中深层精细速度分析技术
在分析速度谱质量影响因素的基础上,通过对叠前去噪、道集优化处理技术、面元组合方式等进行了深入研究和分析,形成速度分析道集的优化处理技术和方法。
图4-136 第338道补偿前后能量对比
图4-137 第100道补偿前后时频谱
通过优化速度分析面元的组合,可以提高覆盖次数,提高速度谱质量。目前处理中一般选取矩形组合,研究对比了矩形、十字形、椭圆形三种组合方式,由于椭圆形组合既能保证一定的覆盖次数又舍去了距面元中心较远的道,从分辨率和能量两个方面考虑,椭圆形组合的效果更好。
3.中深层精确成像技术
应用针对中深层油气藏的配套处理技术,叠前地震数据的规则化、叠前道内插处理、叠前时间偏移等技术,在五号桩、民丰等三维区块取得了明显处理效果。从图4-138处理剖面的效果看,五号桩洼陷内古近系沙河街组波阻的连续性和叠置关系等特征更明显,如超覆、尖灭、前积、退积、砂砾岩体、滩坝等地质现象更清楚,为深层结构分析、地质体的识别描述和地层的接触关系提供了基础。
图4-138 五号桩高精度剖面效果对比
(纵线左:老剖面;右:新剖面)
(三)中深层油气藏地震描述关键技术
针对沙四-孔店等中深层砂岩油藏勘探中存在的实际问题,从地震资料特殊处理、储层沉积背景分析、正演模拟、地层压力预测及相控多属性储层综合预测等诸方面展开深入研究,形成了以沙四上滩坝砂岩油藏为代表的地震描述技术流程,取得了良好的应用效果。
1.沉积背景信息恢复与分析技术
古地形地貌是控制盆地内沉积相发育与分布的主导因素之一,基准面旋回变化控制着层序地层单元的结构类型、叠加样式,高分辨率层序地层学方法恢复古地貌技术关键是对比参照面的选择。等时性的基准面在整个盆地中是一个连续光滑的曲面,在不同的沉积体系发育位置,其曲率大小不同,可以基准面作为对比参考面恢复下伏地层沉积前的古地貌形态;另外,最大洪泛面在实际对比中具有更好的实际操作性,因此将二者结合进行地层柱状剖面对比来反映沉积前古地貌形态是该方法的技术关键。图4-139是东营凹陷沙四上纯下段沉积前古地貌图,古地貌形态基本消除了断层的影响,更加符合滩坝砂岩的平面分布规律,与实际钻井情况吻合的较好。
图4-139 东营凹陷沙四上纯下段沉积前古地貌图
2.高精度空间层序划分技术
该技术主要是对地震资料进行滤波、倾角/方位角处理,随后对沉积旋回进行自动对比,经Wheller域变换之后,实现对地震层序的划分。包括倾角/方位角控制处理、沉积旋回韵律体层序自动对比、Wheeler域自动变换技术三个关键环节,在陡坡带砂砾岩体层序研究中成效显著。
3.相控地震属性储层预测技术
地震属性是指从地震数据中导出的关于几何学、运动学、动力学及统计特性的特殊度量值。根据滩坝砂岩发育的实际地质特点,开发了基于波形的学习型地震波形预测技术和基于同相轴及数据体的不同属性的降维分析储层定量评价技术。
基于不同属性的降维分析储层定量评价技术:基于不同数据体提取多种沿层地震属性,通过交汇分析选择出最佳的属性组合,用该属性组合与储层沉积参数采用BP神经网络的算法进行人工智能储层预测,实现沉积相控制下的储层定量评价。该技术是在以往基于同相轴的单一地震属性储层预测基础上发展起来,改进了单一地震属性在储层预测方面存在的不足,实现了储层描述从定性描述向定量预测的跨越。图4-140是纯斜103地区11种属性降维结果储层预测图,该区坝砂较为发育,砂体单层厚度较大,层数相对较少,从图中可以看出第一主成分特征明显,较好地反映了坝砂的分布规律。
(四)五号桩高精度地震应用
五号桩工区构造上位于胜利探区孤北洼陷东部,已发现五号桩油田及多个含油区块,勘探目的层以古近系为主,发育近岸水下扇体、浊积等多种储集类型,勘探程度不均衡,中深层岩性及潜山具有较大勘探潜力。区内已被三维地震覆盖,但老资料信噪比、分辨率低,难以满足岩性及断裂带精细描述的需要。
图4-140 纯斜103区属性降维结果
(左:第一主成分;右:第二主成分)
五号桩地区地处海陆过渡带,近地表条件特殊、地下地质结构复杂、沉积类型多样,高精度三维地震资料的主要地质任务是为了落实孤北洼陷带的构造格局,查清该区构造、岩性、地层等多类型圈闭,需要解决近地表岩性激发、提高中深层资料信噪比和分辨率、岩性及中深层地质目标成像等问题。
1.地震采集关键技术
1)针对勘探目标的精细采集参数论证技术
针对五号桩地区的地质目标,关键是在提高深层地震资料信噪比的基础上提高分辨率,压制干扰波,突出有效波,努力拓宽有效频带。通过采集参数论证,根据地表和地质条件,设计面向地质目标的观测系统。与常规三维的采集参数相比,体现为高覆盖次数、长排列、道密度大,保证了目的层高品质资料采集(表4-18)。
表4-18 五号桩高精度采集与常规三维采集参数对比
2)精细表层结构调查
五号桩地区近地表复杂,为了确定表层调查方法的适用性和有效性,在五号桩工区展开了小折射、单井(双井)微测井、动力岩性探测、静力岩性探测、岩心测定等10种方法试验,小折射、单井微测井可以准确测试近地表速度参数,动力岩性探测、静力岩性探测可以优选最佳激发岩性。
根据动力岩性探测、静力岩性探测和岩土参数综合分析,建立岩性顶底界面模型,根据模型逐点设计浮动激发井深。
3)采集效果
通过精细表层结构调查后,选取最佳激发岩性,采用针对地质目标观测系统使资料质量有了大幅提高。单炮记录远、中、近排列,能量较强,资料整体信噪比较高,主要目的层能量较强,反射良好,同相轴连续性较好;新单炮各目的层同相轴连续,反射明显,深层能量强,信噪比较高。
2.地震资料处理关键技术
五号桩工区由于地理位置位于滩浅海地区,地表条件复杂,资料存在能量、信噪比、相位、频率等方面差异,一致性处理难度很大。通过加强地质认识,对工区勘探开发现状、地质目标需求、老资料存在的问题、野外采集资料进行了全面细致的分析,根据资料分析情况和叠前时间偏移技术要求,确定处理重点,采取针对性措施解决了一致性问题、静校正问题、信噪比问题、分辨率问题等影响偏移成像的问题(表4-19),地震资料品质得到改善。
表4-19 五号桩地区资料处理重点及解决方法
1)频谱对比分析
五号桩高精度地震资料比老资料目的层优势频带拓宽13Hz以上,有效频宽拓宽22Hz以上(图4-141)。
2)断裂反射清楚,断点可靠,边界断裂归位较好
五号桩高精度三维断点归位准确(图4-142),老资料断点发生偏移近150m;可分辨小断层的断距变小,提高了分辨小断层能力,由原来的可分辨最小断距25m提高到可分辨最小断距20m。
3)信噪比高,地质现象清楚
对比新老资料可以看出,五号桩高精度资料信噪比高,地质现象清楚,资料整体成像明显改善。高精度资料上,浊积砂体前积特征清楚,桩606井3221~3227m储层在高精度资料上可以分辨,而在老资料上无法分辨。
3.地震解释及应用效果
1)精细构造解释
长堤断层、桩南断层、孤北断层等控洼断层,断面倾角大,断层为洼陷与潜山的分界,速度差异大,利用常规叠后偏移处理技术不能满足成像分辨率要求,从图4-143中可以看出,在桩海连片资料上长堤断层、桩古63台阶断层断面不清晰甚至没有反映,而在五号桩高精度叠前时间偏移三维资料上,三条断层断面清楚,成像精确,尤其是长堤断层与次级断层接触关系明确,减少多解性,有助于解释人员的正确判断。长堤潜山在古生界发育有逆冲断层,在常规采集的地震资料(桩海连片三维)都无法辨别逆冲断面,而在高精度三维资料上不但断面清晰,而且断点清楚,与长堤断层的接触关系也比较明朗,已经部署了桩古60井,为长堤潜山下一步勘探打下了坚实的基础。
图4-141 五号桩常规地震(左)高精度(右)三维频谱分析图
图4-142 五号桩高精度偏移剖面(上)与老剖面(下)对比
图4-143 过桩古63井纵线高精度偏移剖面(右)与连片老剖面(左)对比
2)储层地震属性预测
高精度资料明显提高了储层分辨力,平面上能够划分浊积砂体的期次,可描述不同期次浊积砂体的展布范围;在储盖组合合理的情况下,高精度资料辨别储层的能力提高30%。
利用常规连片三维和高精度三维资料,对沙三下第二套油层进行属性提取预测储层分布,对比可以看出高精度叠前时间偏移资料明显优于叠后时间偏移资料。桩海连片资料提取的属性图仅能看到扇体展布的大体轮廓,而利用高精度资料提取的属性图(图4-144),桩74井区的浊流水道清晰可见,并且更能体现浊积扇体由南向北逐步撒开的形态。通过对不同阶段采集的地震资料对比,在平面预测时,五号桩三维资料体现了其小面元、高分辨率的优越性,对沙三下三套油层均能够较为准确地预测边界,反映不同沉积类型的储层展布规律。
图4-144 桩海连片三维弧长属性图(右)与五号桩三维弧长属性图(左)对比图
在剖面上对单个储层的分辨力而言,不同的三维也存在较大的差异。对于沙三下Ⅰ油层,在以往的认识中,受资料限制,在地震剖面上该油层同相轴时有时无,无法追踪,在沉积上通常认为是扇三角洲沉积,储层均质性好,大面积含油。在五号桩新三维剖面上,同相轴可追踪,振幅强弱有变化,并可见到明显的叠瓦状反射,分析认为是多期浊积扇体由南向北层层叠置。
3)地质效果
应用五号桩高精度地震资料完成了区域的T2及T6构造图,高精度地震资料属性参数预测储层变化边界清晰,储层迁移规律清楚(南北向迁移),物源方向反映清楚,两期浊积体系均来自南部,上下叠置,展布范围有所不同,利用高精度地震属性预测的储层分布符合地质规律。基于这个认识,对五号桩南斜坡沙河街组岩性体进行描述,预测有利圈闭12个,预测含油面积11.0km2,预测石油地质储量1000×104t,部署桩606、桩607、桩781等井,其中桩606井在沙一段、沙二段解释油水同层3.2m/1层,沙三段解释油层31.7m/6层,油水同层4m/层,沙三下3692~3699m井段试油,3mm油嘴,获日产油75m3、天然气产量4720m3。
B. 预测未来油价改用什么数学建模模型
建议用BP神经网络,并且结合主成分分析法。
一些常用的方法,比如多元回归和时间序列方法构建价格预测模型,是一种典型的线性预测模型,能够预测价格变化的线性关系,对中长期预测具有一定的局限性。
神经网络是一种智能预测方法,需要对对象建立准确的数学模型,能够准确描述对象的特征,具有学习能力强、并行处理等特点,在复杂系统等领域的建模中得到了广泛的应用,也为石油价格预测提供了思路。但是由于影响石油价格的因子比较多,且数据中含有噪声,直接采用神经网络学习收敛速度慢,且预测精度低,因此需要对石油价格影响因子预处理。针对石油价格变化的特点,提出一种基于主成分分析和BP神经网络的石油价格预测模型。该模型采用定性分析选择出影响因子,再利用主成分分析方法对石油价格影响因子进行筛选,选取最主要的几个影响因素,最后通过神经网络能够逼近非线性连续函数的能力对石油价格进行预测,从而实现了石油价格的准确预测。
价格的预测过程
BP神经网络的预测过程如下:
1、收集石油价格以及影响因子,并获取相关数据。
2、对石油价格影响因子进行主成分分析,并筛选出贡献率大的主成分。
3、将石油价格数据分为训练样本和预测样本。
4、采用BP神经网络对训练样本进行训练,并找出模型的最优参数。
5、利用最有参数建立BP神经网络预测模型,对预测样本进行预测。
C. 什么叫数据挖掘、神经网络
数据挖掘是从大量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程。
1. 数据挖掘能做什么?
1)数据挖掘能做以下六种不同事情(分析方法):
分类 (Classification)
估值(Estimation)
预言(Prediction)
相关性分组或关联规则(Affinity grouping or association rules)
聚集(Clustering)
描述和可视化(Des cription and Visualization)
2)数据挖掘分类
以上六种数据挖掘的分析方法可以分为两类:直接数据挖掘;间接数据挖掘
直接数据挖掘
目标是利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定的变量(可以
理解成数据库中表的属性,即列)进行描述。
间接数据挖掘
目标中没有选出某一具体的变量,用模型进行描述;而是在所有的变量中建立起某种关系
。
分类、估值、预言属于直接数据挖掘;后三种属于间接数据挖掘
3)各种分析方法的简介
分类 (Classification)
首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分
类模型,对于没有分类的数据进行分类。
例子:
a. 信用卡申请者,分类为低、中、高风险
b. 分配客户到预先定义的客户分片
注意: 类的个数是确定的,预先定义好的
估值(Estimation)
估值与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的
输出;分类的类别是确定数目的,估值的量是不确定的。
例子:
a. 根据购买模式,估计一个家庭的孩子个数
b. 根据购买模式,估计一个家庭的收入
c. 估计real estate的价值
一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的
连续变量的值,然后,根据预先设定的阈值,进行分类。例如:银行对家庭贷款业务,运
用估值,给各个客户记分(Score 0~1)。然后,根据阈值,将贷款级别分类。
预言(Prediction)
通常,预言是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用
于对未知变量的预言。从这种意义上说,预言其实没有必要分为一个单独的类。
预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时
间后,才知道预言准确性是多少。
相关性分组或关联规则(Affinity grouping or association rules)
决定哪些事情将一起发生。
例子:
a. 超市中客户在购买A的同时,经常会购买B,即A => B(关联规则)
b. 客户在购买A后,隔一段时间,会购买B (序列分析)
聚集(Clustering)
聚集是对记录分组,把相似的记录在一个聚集里。聚集和分类的区别是聚集不依赖于预先
定义好的类,不需要训练集。
例子:
a. 一些特定症状的聚集可能预示了一个特定的疾病
b. 租VCD类型不相似的客户聚集,可能暗示成员属于不同的亚文化群
聚集通常作为数据挖掘的第一步。例如,"哪一种类的促销对客户响应最好?",对于这一类问题,首先对整个客户做聚集,将客户分组在各自的聚集里,然后对每个不同的聚集,回答问题,可能效果更好。
描述和可视化(Des cription and Visualization)
是对数据挖掘结果的表示方式。
2.数据挖掘的商业背景
数据挖掘首先是需要商业环境中收集了大量的数据,然后要求挖掘的知识是有价值的。有
价值对商业而言,不外乎三种情况:降低开销;提高收入;增加股票价格。
1)数据挖掘作为研究工具 (Research)
2)数据挖掘提高过程控制(Process Improvement)
3)数据挖掘作为市场营销工具(Marketing)
4)数据挖掘作为客户关系管理CRM工具(Customer Relationship Management)
3.数据挖掘的技术背景
1)数据挖掘技术包括三个主要部分:算法和技术;数据;建模能力
2)数据挖掘和机器学习(Machine Learning)
机器学习是计算机科学和人工智能AI发展的产物
机器学习分为两种学习方式:自组织学习(如神经网络);从例子中归纳出规则(如决策树)
数据挖掘由来
数据挖掘是八十年代,投资AI研究项目失败后,AI转入实际应用时提出的。它是一个新兴
的,面向商业应用的AI研究。选择数据挖掘这一术语,表明了与统计、精算、长期从事预
言模型的经济学家之间没有技术的重叠。
3)数据挖掘和统计
统计也开始支持数据挖掘。统计本包括预言算法(回归)、抽样、基于经验的设计等
4)数据挖掘和决策支持系统
数据仓库
OLAP(联机分析处理)、Data Mart(数据集市)、多维数据库
决策支持工具融合
将数据仓库、OLAP,数据挖掘融合在一起,构成企业决策分析环境。
4. 数据挖掘的社会背景
数据挖掘与个人预言:数据挖掘号称能通过历史数据的分析,预测客户的行为,而事实上,客户自己可能都不明确自己下一步要作什么。所以,数据挖掘的结果,没有人们想象中神秘,它不可能是完全正确的。
5.数据挖掘技术实现
在技术上可以根据它的工作过程分为:数据的抽取、数据的存储和管理、数据的展现等关键技术。
1) 数据的抽取
数据的抽取是数据进入仓库的入口。由于数据仓库是一个独立的数据环境,它需要通过抽取过程将数据从联机事务处理系统、外部数据源、脱机的数据存储介质中导入数据仓库。数据抽取在技术上主要涉及互连、复制、增量、转换、调度和监控等几个方面的处理。在数据抽取方面,未来的技术发展将集中在系统功能集成化方面,以适应数据仓库本身或数据源的变化,使系统更便于管理和维护。
2) 数据的存储和管理
数据仓库的组织管理方式决定了它有别于传统数据库的特性,也决定了其对外部数据的表现形式。数据仓库管理所涉及的数据量比传统事务处理大得多,且随时间的推移而快速累积。在数据仓库的数据存储和管理中需要解决的是如何管理大量的数据、如何并行处理大量的数据、如何优化查询等。目前,许多数据库厂家提供的技术解决方案是扩展关系型数据库的功能,将普通关系数据库改造成适合担当数据仓库的服务器。
3) 数据的展现
在数据展现方面主要的方式有:
查询:实现预定义查询、动态查询、OLAP查询与决策支持智能查询;报表:产生关系数据表格、复杂表格、OLAP表格、报告以及各种综合报表;可视化:用易于理解的点线图、直方图、饼图、网状图、交互式可视化、动态模拟、计算机动画技术表现复杂数据及其相互关系;统计:进行平均值、最大值、最小值、期望、方差、汇总、排序等各种统计分析;挖掘:利用数据挖掘等方法,从数据中得到关于数据关系和模式的知识。
6.数据挖掘与数据仓库融合发展
数据挖掘和数据仓库的协同工作,一方面,可以迎合和简化数据挖掘过程中的重要步骤,提高数据挖掘的效率和能力,确保数据挖掘中数据来源的广泛性和完整性。另一方面,数据挖掘技术已经成为数据仓库应用中极为重要和相对独立的方面和工具。
数据挖掘和数据仓库是融合与互动发展的,其学术研究价值和应用研究前景将是令人振奋的。它是数据挖掘专家、数据仓库技术人员和行业专家共同努力的成果,更是广大渴望从数据库“奴隶”到数据库“主人”转变的企业最终用户的通途。
D. 神经网络,线性回归,主成分分析法,决策树哪个不属于监督学习
主成分分析法不属于监督学习,而是属于无监督学习。
E. 研究人工神经网络的权值分布有什么意义
神经网络一般都是非常庞大的,每个边对应一个权值,如果权值不共享的话,数据量就更大了,但是为了提高效率,引入了权值共享,但是还不够,想再次提高效率和精确度,进行主成分分析,把一些重要的权重保留,不重要的舍弃,你这个权值分布就很有意义了,比如权重是5的权值在概率上占到了百分之95,或者说主成分分析的结果前2类权重就占据了百分之80,那么剩下的权值就可以省略,当然这都是理论上的