<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>互联网乌托邦 &#187; 购物搜索</title>
	<atom:link href="http://www.javey.org/archives/tag/%e8%b4%ad%e7%89%a9%e6%90%9c%e7%b4%a2/feed" rel="self" type="application/rss+xml" />
	<link>http://www.javey.org</link>
	<description>产品设计,网站运营,网络营销,SEO优化推广</description>
	<lastBuildDate>Sat, 07 Jan 2012 08:16:49 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.2.1</generator>
		<item>
		<title>什么是商业搜索？国内商业搜索引擎主要有哪些？</title>
		<link>http://www.javey.org/archives/55.html</link>
		<comments>http://www.javey.org/archives/55.html#comments</comments>
		<pubDate>Wed, 26 Aug 2009 15:14:24 +0000</pubDate>
		<dc:creator>Javey</dc:creator>
				<category><![CDATA[互联网]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[商业搜索]]></category>
		<category><![CDATA[垂直搜索]]></category>
		<category><![CDATA[搜索引擎]]></category>
		<category><![CDATA[电子商务]]></category>
		<category><![CDATA[谷歌]]></category>
		<category><![CDATA[购物搜索]]></category>

		<guid isPermaLink="false">http://www.javey.org/archives/55</guid>
		<description><![CDATA[前一篇文章中提到了当下垂直搜索引擎，本文将主要介绍当下一些比较知名的商业搜索引擎。 什么是商业搜索？ 顾名思义，商业搜索是指定位于商业领域、满足商人信息需求的搜索引擎。与传统搜索相比，商业搜索只查询与商业相关的公司、产品、供求等信息，这主要通过对行业网站的定向搜索和企业提交而来，所有的信息都经过部分人工和技术上的审核，保证了信息的真实性、准确性和商业价值。 业界通称的商业搜索概念主要是指企业搜索，它通过搜索引擎提供高效便捷的商贸信息沟通，实现B2B的商贸功能和商业服务功能，提高信息正确率和商业利用率，本质上是电子商务和搜索引擎的结合体。 商业搜索引擎的完整概念包括企业搜索、产品搜索、商机搜索、商业服务搜索，具体实现企业信息、产品信息、买卖信息、招商信息、代理信息、广告服务、融资服务功能，融合了行业搜索、类别搜索功能，是完整意义上的相对专业化综合搜索和相对性垂直搜索的综合体。 国内主要的商业搜索引擎 谷歌购物搜索 http://www.google.cn/products or  http://www.google.cn/gouwu 谷歌购物搜索于今年5月份上线，不过不要以为谷歌才推出购物搜索功能，早在2002年底Google就发布了Froogle，就是购物搜索的前身，后于2007年4月将这个匪夷所思的怪名字进化为更直白的Products Search，但其实Froogle到Products Search除了名字的变化，核心内容基本上换汤不换药，用户看的到的只是详细搜索选项从页面头部变到了尾部，当然也许会有搜索算法上的改进但不容易直接体验的出来。 258商业搜索——商人的搜索   http://www.258.com/  http://www.yinsu.com/ [...]]]></description>
			<content:encoded><![CDATA[<p>前一篇文章中提到了<a title="当下垂直搜索引擎集锦一" href="../archives/41" target="_blank">当下垂直搜索引擎</a>，本文将主要介绍当下一些比较知名的商业搜索引擎。</p>
<p><strong>什么是商业搜索？</strong></p>
<p>顾名思义，商业搜索是指定位于商业领域、满足商人信息需求的搜索引擎。与传统搜索相比，商业搜索只查询与商业相关的公司、产品、供求等信息，这主要通过对行业网站的定向搜索和企业提交而来，所有的信息都经过部分人工和技术上的审核，保证了信息的真实性、准确性和商业价值。</p>
<p>业界通称的商业搜索概念主要是指企业搜索，它通过搜索引擎提供高效便捷的商贸信息沟通，实现B2B的商贸功能和商业服务功能，提高信息正确率和商业利用率，本质上是电子商务和搜索引擎的结合体。</p>
<p>商业搜索引擎的完整概念包括企业搜索、产品搜索、商机搜索、商业服务搜索，具体实现企业信息、产品信息、买卖信息、招商信息、代理信息、广告服务、融资服务功能，融合了行业搜索、类别搜索功能，是完整意义上的相对专业化综合搜索和相对性垂直搜索的综合体。</p>
<p><strong>国内主要的商业搜索引擎</strong></p>
<p>谷歌购物搜索 <a title="谷歌购物搜索" href="http://www.google.cn/products" target="_blank">http://www.google.cn/products</a> or  <a href="http://www.google.cn/gouwu" target="_blank">http://www.google.cn/gouwu</a></p>
<p>谷歌购物搜索于今年5月份上线，不过不要以为谷歌才推出购物搜索功能，早在2002年底Google就发布了Froogle，就是购物搜索的前身，后于2007年4月将这个匪夷所思的怪名字进化为更直白的Products Search，但其实Froogle到Products Search除了名字的变化，核心内容基本上换汤不换药，用户看的到的只是详细搜索选项从页面头部变到了尾部，当然也许会有搜索算法上的改进但不容易直接体验的出来。</p>
<p>258商业搜索——商人的搜索   http://www.258.com/  http://www.yinsu.com/</p>
<p>258 商业搜索（原来的音速Anyso搜索http://www.anyso.com/）是全球最早的多语言商业搜索引擎，是厦门书生于2003年开始研究的技术和服务，致力于成为全球商人的商业入口服 务，实时搜索全球超过6000家B2B平台的近10亿条商业信息，提供商业信息、商情、产品、公司、黄页、行情、贸易、商务动态、外贸信息、国际贸易等搜 索服务。</p>
<p>搜度——全球商业搜索引擎，搜索公司，产品及买卖信息 http://www.sodu.com/</p>
<p>搜度是一家面向全球范围中小企业提供全面、准确的商业信息检索服务的商业搜索引擎，融合搜索引擎和电子商务的专业技术，有搜索引擎和电子商务双向特征，可以象Google一样的搜索引擎使用，也可以发布普通的B2B信息。</p>
<p>搜库网——商业资料搜索 http://www.souku.com.cn/</p>
<p>搜库网是最大的中文商业资料搜索引擎，加盟数据库涉及IT、通信、石化、冶金、财经、法律、医药、汽车等158个行业，涵盖专利、标准、图表、数据、报告、论文等内容。</p>
<p>知信者 &#8211; 中国最优秀的商业搜索引擎 http://www.zhixinzhe.com/</p>
<p>知信者是一款“会说话”的商业搜索引擎，它推出了一项新颖的商业搜索服务，即当网民查到相关企业信息后，如果对企业产品感兴趣，不需要进入企业网站，直接通过知信者提供的免费通话服务，就可以向企业咨询。</p>
<p>商搜——专业的中文商业搜索引擎 http://www.shangsou.com</p>
<p>天 网商搜是由上海弄潮网络公司和北京天网公司共同投资和研发的面向商务的垂直化搜索引擎，堪称为中国首家开创电子商务与商业搜索对接的全新网络盈利模式，是 集商业搜索引擎、电子商务、企业门户、企业网站建设、企业商机信息等于一体的聚合型电子商务网络门户，汇集了中国350万家企业、商品、供求信息，是企业 发布商业信息、开展电子商务的平台。</p>
<p>锣鼓网——商机、产品搜索引擎 http://www.legoo.com/</p>
<p>锣鼓网是一家以即时商业信息为搜索对象的商业搜索引擎，是涵盖求购、供应、产品、公司和行业资讯、生意经验等各方面的专业商业信息搜索平台，在这里您可以及时获取最新的商业信息。</p>
<p>金泉网——中文商业搜索引擎 http://www.jqw.com/</p>
<p>金泉网于2004年1月1日正式上线，主要提供企业黄页、企业名录、产品搜索、买卖搜索、商贸资讯及人才求职招聘等商业信息搜索服务。目前，金泉网已囊括了中国1800多万企业库、5000多万产品库，信息量大、覆盖面广、搜索结果准确。</p>
<p>一呼百应——专业供求信息搜索引擎 http://www.youboy.com/</p>
<p>雅虎商业搜索 http://biz.yahoo.cn/</p>
<p>阿里巴巴电子商务平台商业搜索 http://china.alibaba.com</p>
<p><strong>前景展望</strong>：随着电子商务的进一步炙热化，基于电子商务平台的垂直搜索引擎必然是一个需求点。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.javey.org/archives/55.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>何谓垂直搜索</title>
		<link>http://www.javey.org/archives/39.html</link>
		<comments>http://www.javey.org/archives/39.html#comments</comments>
		<pubDate>Tue, 28 Jul 2009 16:57:56 +0000</pubDate>
		<dc:creator>Javey</dc:creator>
				<category><![CDATA[互联网]]></category>
		<category><![CDATA[分词]]></category>
		<category><![CDATA[垂直搜索]]></category>
		<category><![CDATA[垂直搜索引擎]]></category>
		<category><![CDATA[搜索引擎]]></category>
		<category><![CDATA[索引]]></category>
		<category><![CDATA[行业搜索]]></category>
		<category><![CDATA[购物搜索]]></category>

		<guid isPermaLink="false">http://www.javey.org/archives/39</guid>
		<description><![CDATA[一、什么是垂直搜索 垂直搜索是针对某一个行业的专业搜索引擎，是搜索引擎的细分和延伸，是对网页库中的某类专门的信息进行一次整合，定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。 垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取，也就是将网页的非结构化数据抽取成特定的结构化信息数据，好比网页搜索是以网页为最小单位，基于视觉的网页块分析是以网页块为最小单位，而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库，进行进一步的加工处理，如：去重、分类等，最后分词、索引再以搜索的方式满足用户的需求。 整个过程中，数据由非结构化数据抽取成结构化数据，经过深度加工处理后以非结构化的方式和结构化的方式返回给用户。 垂直搜索引擎的应用方向很多，比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。 二、垂直搜索技术概述 垂直搜索技术主要分为两个层次：模板级和网页库级。 模板级是针对网页进行模板设定或者自动生成模板的方式抽取数据，对网页的采集也是针对性的采集，适合规模比较小、信息源少且稳定的需求，优点是快速实施、成本低、灵活性强，缺点是后期维护成本高，信息源和信息量小。 网页库级就是在信息源数量上、数据容量上检索容量上、稳定性可靠性上都是网页库搜索引擎级别的要求，和模板方式最大的区别是对具体网页不依赖，可针对任意正常的网页进信息采集信息抽取……。这就导致这种方式数据容量上和模板方式有质的区别，但是其灵活性差、成本高。当然模板方式和网页库级的方式不是对立的，这两者对于垂直搜索引擎来说是相互补充的，因为技术只是手段，目的是切反用户之需。本文谈及的技术主要是指网页库级别垂直搜索引擎技术。 三、垂直搜索引擎的主要技术 1、信息采集技术： 垂直搜索引擎spider和网页库的spider相比应该是更加专业，可定制化。可定向性的采集和垂直搜索范围相关的网页忽略不相关的网页和不必要的网页，选择内容相关的以及适合做进一步处理的网页深度优先采集、对页面有选择的调整更新频率……，采集可通过人工设定网址和网页分析url方式共同进行。垂直搜索对信息的更新有着特别的要求，根据这些特点可以从以下几点考虑1.信息源的稳定性（不能让信息源网站感觉到spider的压力）2.抓取的成本问题3.对用户体验改善程度。根据以上几点制定一种比较好的策略，要做到恰到好处。策略上可以评估网站/网页更新的系数、网站/网页的重要系数、用户点击系数（或曝光系数）、网站稳定系数……，根据这些系数来确定对这些网站/网页更新的频率。再由于新信息和更新了的信息list页面前面或者首页，所以对网页进行很好的分级可以以低成本很好的解决更新问题，系数比较低的网页一月update一次，稍微高点的一周update一次、中等的几天到一天一次、高的几小时到几分钟一次。类似搜索引擎的大库、周库、日库，小时库…… 2、网页信息抽取技术： 结构化信息抽取技术，将网页中的非结构化数据按照一定的需求抽取成结构化数据。有两种方式，简单的就是模板方式，另外就是对网页不依赖web结构化信息抽取方式，这两种方式可以互取长处，以最简单最有效的办法满足需求。垂直搜索引擎和通用搜索引擎最大的区别就是对网页信息结构化抽取后再结构化数据进行深度的处理，提供专业的搜索服务。所以web结构化信息抽取的技术水平是决定垂直搜索引擎质量的重要技术指标。其实web结构化信息抽取在百度、google早已经广泛应用了，如：MP3、图片搜索、google的本地搜索就是从网页库抽取出企业信息，添加到其地图搜索中的，google通过这种技术正在颠覆做内容的方式。同样的技术应用还在qihoo、sogou购物、shopping等各种应用中体现。 3、简单的语法分析： 简单的语法分析在搜索引擎中非常重要，可以通过简单的语法分析来改善数据的质量，低成本的获得某类信息，改善排序，寻找需要的内容…… [...]]]></description>
			<content:encoded><![CDATA[<p>一、什么是垂直搜索<br />
垂直搜索是针对某一个行业的专业搜索引擎，是搜索引擎的细分和延伸，是对网页库中的某类专门的信息进行一次整合，定向分字段抽取出需要的数据进行处理后再以某种形式返回给用户。<br />
垂直搜索引擎和普通的网页搜索引擎的最大区别是对网页信息进行了结构化信息抽取，也就是将网页的非结构化数据抽取成特定的结构化信息数据，好比网页搜索是以网页为最小单位，基于视觉的网页块分析是以网页块为最小单位，而垂直搜索是以结构化数据为最小单位。然后将这些数据存储到数据库，进行进一步的加工处理，如：去重、分类等，最后分词、索引再以搜索的方式满足用户的需求。<br />
整个过程中，数据由非结构化数据抽取成结构化数据，经过深度加工处理后以非结构化的方式和结构化的方式返回给用户。<br />
垂直搜索引擎的应用方向很多，比如企业库搜索、供求信息搜索引擎、购物搜索、房产搜索、人才搜索、地图搜索、mp3搜索、图片搜索……几乎各行各业各类信息都可以进一步细化成各类的垂直搜索引擎。</p>
<p>二、垂直搜索技术概述<br />
垂直搜索技术主要分为两个层次：模板级和网页库级。<br />
模板级是针对网页进行模板设定或者自动生成模板的方式抽取数据，对网页的采集也是针对性的采集，适合规模比较小、信息源少且稳定的需求，优点是快速实施、成本低、灵活性强，缺点是后期维护成本高，信息源和信息量小。<br />
网页库级就是在信息源数量上、数据容量上检索容量上、稳定性可靠性上都是网页库搜索引擎级别的要求，和模板方式最大的区别是对具体网页不依赖，可针对任意正常的网页进信息采集信息抽取……。这就导致这种方式数据容量上和模板方式有质的区别，但是其灵活性差、成本高。当然模板方式和网页库级的方式不是对立的，这两者对于垂直搜索引擎来说是相互补充的，因为技术只是手段，目的是切反用户之需。本文谈及的技术主要是指网页库级别垂直搜索引擎技术。</p>
<p>三、垂直搜索引擎的主要技术<br />
1、信息采集技术：<br />
垂直搜索引擎spider和网页库的spider相比应该是更加专业，可定制化。可定向性的采集和垂直搜索范围相关的网页忽略不相关的网页和不必要的网页，选择内容相关的以及适合做进一步处理的网页深度优先采集、对页面有选择的调整更新频率……，采集可通过人工设定网址和网页分析url方式共同进行。垂直搜索对信息的更新有着特别的要求，根据这些特点可以从以下几点考虑1.信息源的稳定性（不能让信息源网站感觉到spider的压力）2.抓取的成本问题3.对用户体验改善程度。根据以上几点制定一种比较好的策略，要做到恰到好处。策略上可以评估网站/网页更新的系数、网站/网页的重要系数、用户点击系数（或曝光系数）、网站稳定系数……，根据这些系数来确定对这些网站/网页更新的频率。再由于新信息和更新了的信息list页面前面或者首页，所以对网页进行很好的分级可以以低成本很好的解决更新问题，系数比较低的网页一月update一次，稍微高点的一周update一次、中等的几天到一天一次、高的几小时到几分钟一次。类似搜索引擎的大库、周库、日库，小时库……<br />
2、网页信息抽取技术：<br />
结构化信息抽取技术，将网页中的非结构化数据按照一定的需求抽取成结构化数据。有两种方式，简单的就是模板方式，另外就是对网页不依赖web结构化信息抽取方式，这两种方式可以互取长处，以最简单最有效的办法满足需求。垂直搜索引擎和通用搜索引擎最大的区别就是对网页信息结构化抽取后再结构化数据进行深度的处理，提供专业的搜索服务。所以web结构化信息抽取的技术水平是决定垂直搜索引擎质量的重要技术指标。其实web结构化信息抽取在百度、google早已经广泛应用了，如：MP3、图片搜索、google的本地搜索就是从网页库抽取出企业信息，添加到其地图搜索中的，google通过这种技术正在颠覆做内容的方式。同样的技术应用还在qihoo、sogou购物、shopping等各种应用中体现。<br />
3、简单的语法分析：<br />
简单的语法分析在搜索引擎中非常重要，可以通过简单的语法分析来改善数据的质量，低成本的获得某类信息，改善排序，寻找需要的内容……<br />
4、信息处理技术：<br />
信息处理包括的范围比较广，主要包括去重、聚类、分析……，这根据需要相关的技术就非常多。<br />
5、数据挖掘：<br />
找出您的信息的关联性对于垂直搜索来说非常重要，有效，可以在这些相关性上为用户提供更细致的服务。<br />
6、分词技术：<br />
面向搜索的分词技术，建立和您的行业相关的词库。注意这是面向搜索的分词，不是面向识别和准确的分词。就这个工作安排十几个人不停的维护也不会嫌多。<br />
7、索引技术：<br />
索引技术对于垂直搜索非常关键，一个网页库级的搜索引擎必须要支持分布索引、分层建库、分布检索、灵活的更新、灵活的权值调整、灵活的索引和灵活的升级扩展、高可靠性稳定性冗余性。还需要支持各种技术的扩展，如偏移量计算等。</p>
<p>四、如何做好垂直搜索引擎<br />
垂直搜索的进入门槛很低，但是竞争的门槛很高。没有专注的精神和精湛的技术是不行的。行业门户网站具备行业优势但他们又是没有技术优势的，绝对不要想像着招几个人就可以搞定垂直搜索的全部技术，作为一个需要持续改进可运营的产品而不是一个项目来说对技术的把握控制程度又是垂直搜索成功的重要因素之一。<br />
搜索引擎的技术和理念都是需要时间和经验的积累的，绝对不要认为可以一蹴而就。原因是因为搜索引擎太复杂，而且用户无法描述他要找什么，除非让他看到想找的东西。<br />
搜索引擎是一个给用户提供服务的产品，需要长期的不断的改进升级调整才能持续不断的提用户体验。千万不要把搜索当成项目来做，做完了撂那让用户去用那你肯定没戏。垂直搜索引擎，麻雀虽小五脏俱全。无论理念文化、产品管理、应用、技术都和搜索引擎的楔形理论没有什么区别。所以要做好一垂直搜索必须解决这几个方面。<br />
垂直搜索引擎的技术评估应从以下几点来判断<br />
1. 全面性<br />
2. 更新性<br />
3. 准确性<br />
4. 功能性</p>
<p>对于任何一个产品来说，产品的模式是最重要的，技术只是手段、工具、途径。用户不会关心你的技术是如何实现的、更不会关心你的技术水平是什么样的，只要用户感觉：这就是我需要的东西，很好用，而且是最好用的。那么你的产品就OK了。</p>
<p>垂直搜索的进入门槛很低，但是竞争的门槛很高。没有专注的精神和精湛的技术是不行的。行业门户网站具备行业优势但他们又是没有技术优势的，绝对不要 想像着招几个人就可以搞定垂直搜索的全部技术，作为一个需要持续改进可运营的产品而不是一个项目来说对技术的把握控制程度又是垂直搜索成功的重要因素之一。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.javey.org/archives/39.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>

