铝单板公司工程项目
数据采集分析与知识管理
xxx有限公司
一、网络信息搜索和提取方法
(一)概过
现在,虽然不能说人类所有文献与其他信息都上了互联网,但是
网上的信息极为丰富,许多都可用于咨询。但是,许多咨询人员还不
善于甚至不知道如何从网上快速、安全、有效地获得自己需要的信息
和知识。咨询工程师应当知晓网上有何利信息,应掌握从网上获取信
息的方法与基本技巧。对于网上的信息,可利用浏览器和搜索引擎获取。浏览器是供用户阅读网页内容的软件;而搜索引擎,指从互联网
上搜集信息的特定电脑程序。
早期的搜索引擎是收集互联网中服务器的地址,按这些服务器拥
有的资源类型将其编成不同的目录,各个目录再逐层分类。搜索引擎
则沿着此类层级向下搜索,到用户想要的信息。这种方式只适用于
互联网信息不多的时代。随着互联网上信息的迅猛增长,出现了新式
搜索引擎,性能大为改进,能够到网站每一页的起始地址,随后搜
索网上所有超级链接,把代表超级链接的所有词汇放入一个数据库。
搜索引擎的功能不再限于搜索,已经添加了电子商务、新闻信息服务、个人免费服务等。
(二)搜索引擎工作原理
搜索引擎有信息搜集、信息整理和接受用户查询三部分,各自工
作原理大致如下:
1.搜集信息:搜索引擎利用称为网络蜘蛛(spider)的自动搜索
机器人程序,从少数几个网页开始,将各个网页的超链接连结在一起,只要网页上有适当的超链接,机器人便可以遍历绝大部分网页。
2.整理信息:这个过程称为“建立索引”。搜索引擎不仅要保存
搜集到的信息,还要按照一定规则编排之。这样,搜索引擎无须重新
翻查已保存的所有信息,便能迅速到所要的资料,从而能够大大加
快搜索速度。
3.接受查询:对于每时每刻都会接到的大量用户几乎同时发出的
查询请求,搜索引擎按照各个用户的要求检查自己的索引,能在极短
时间内到用户需要的资料,并交给用户。目前,搜索引擎交给用户
的主要是网页链接,用户按照这些链接便能到含有自己所需资料的
网页。搜索引擎一般会在这些链接下加一段有关这些网页的摘要,以
便用户判断此网页是否含有自己需要的内容。
(三)搜索引擎种类
现在,搜索引擎有很多种,可以从不同的角度分类。
按搜索方法,分全文索引、目录索引、元搜索、垂直搜索、集合
式搜索、门户搜索、个性搜索、专家型搜索与免费链接列表等。
按搜索对象,分购物、自然语言、新闻、MP3、图片等搜索引擎。
按搜索范围,分桌面、地址栏、本地等搜索引擎。
按出现的时间,分第三代、第四代搜索引擎等。
现在,用的较多的搜索引擎有Google,百度、Yahoo、MSNSearch,Webcrawler,Lycos,CNetSearch,LookSmart等。
(四)搜索方法与技巧
要想使搜索引擎能在网上快速到有关咨询的资料,首先要明确
查询目的。目的不同,查询策略与方法不同。在明确目的之后,还应
了解查询的种类与技巧,学会恰当地使用关键词。
搜索方法的选择取决于搜索的内容。不同搜索引擎的复杂条件查
询功能和实现方法各有不同,网站中一般都有“帮助”和“说明”解
释各自的功能和方法。
现在的搜索引擎都有模糊查询功能。当用户输入关键词时,搜索
引擎不但交给用户关键词的网址,还发来与关键词意义相近的内容。
比如,查“建筑报”一词时,模糊查询搜索的结果会有“建筑
报”“建设报”“建筑时报”等的网址。网址的排列,一般是完全符
合关键词在最前边,其次是相近的。模糊查询的结果往往并非用户所需,为了排除不需要的结果,各种搜索引擎也设置了相应的功能。
二、工程咨询信息采集途径
调查方法可分为普查与抽样调查两大类,这两类都有文案调查、
实地调查、问卷调查、实验调查等几种。选择调查方法要考虑收集信
息的能力、调查研究的成本、时间要求、样本控制和人员效应的控制
程度。
上述各种方法,各有利弊,各有适用范围。文案调查是上述各种
调查方法中最简单、最一般和常用的方法,也是其他调查方法的基础。实地调查能够控制调查过程,应用灵活,信息充分,但耗时长、费用多,调查对象易受心理暗示影响,不够客观。问卷调查适应范围广、
简单易行、费用较低,得到了大量应用。实验调查最复杂、费用高、
应用范围有限,但调查结果可信度较高。
(一)文案调查法
文案调查法是指对已经存在的各种资料档案,以查阅和归纳的方
式进行的市场调查。文案调查法又称二手资料或文献调查。文案资料
来源很多,主要有:①国际组织和政府机构资料;②行业资料;③公
开出版物;④相关企业和行业网站;⑤有关企业的内部资料。
(二)问卷调查法
这种方法是调查人员以面谈、电话询问、网上填表或邮寄问卷等
方式,了解调查对象的行为方式,从而收集信息。问卷调查法是市场
调查常用方法,尤其在消费者行为调查中大量应用,其核心工作是设
计问卷,实施问卷调查。
(三)实地调查法
此法是调查人员通过跟踪、记录调查对象的行为取得第一手资料
的方法。这种方法是调查人员直接到市场或某些场所(商品展销会、
商品博览会、商场等)亲身感受或借助于某些摄录设备和仪器,跟踪、记录调查对象的活动、行为和事物的特点,获取所需信息资料。
(四)实验调查法
该法是指调查人员在调查过程中,通过改变某些影响调查对象的
因素,观察调查对象行为的变化,从而获得消费行为和某些因素之间
的内在因果关系。该法主要用于消费行为的调查,企业推出新产品、
改变产品外形和包装、调整产品价格、改变广告方式时,都可以用这
种方法。
三、信息的综合
信息综合是信息工作的重要内容。采集来的信息经常是零散、无序,甚至残缺不全,无法直接使用。对于这样的信息,须进行分析、
联系、推断、整理和组合,使之成为有用信息,然后确定其特征,如
spider软件精度、类型、长度、保密度、保留时间、用途等。

版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。