电子商务的定义
电子是手段,商务是目的。广义上使用各种电子工具从事商务活动,侠义上主要利用Internet从事商务活动。
电子商务发展
电子邮件阶段à信息发布阶段à电子商务阶段
慧聪网是国内B2B电子商务领域的首家上市公司
三大流程
资金流,信息流,物流
电子商务优势和问题
优势:高效率低成本。突破了时空的限制,降低成本,同等竞争的机会,减少差异化,更快更好的客户服务,快速购物比较,提升生产率和流通效率,信息共享、便利和控制,个性化定制。
问题和苏束缚:前期投入,安全性,系统与数据的完整性和可扩展性,客户关系的维护,存在一些不适合在线购买的产品,文化、语言和信任问题,公司脆弱性(泡沫)和高风险,法律法规不完善
电子商务的类型
B2B(Business to Business)
商家对商家的电子商务,即企业与企业之间通过互联网进行产品、服务及信息的交换。
B2B按照服务对象可分为外货B2B及内贸B2B,按照行业性质可分为综合B2B和垂直B2B(专注于某个行业)
B2C(Business to Customer)
综合商城: 正佳广场
专一整合型:麦包包
百货商店:亚马逊
垂直商城:红孩子
复合品牌店:百丽
轻型品牌店:凡客诚品
服务型网店:易美(网上冲印公司)
导购引擎型:蘑菇街
特卖:唯品会
C2C(Consumer to Consumer)
C2C是用户对用户的模式,C2C商务平台就是通过为买卖双方提供一个在线交易平台,是卖方可以主动提供商品上网拍卖,而买方可以自行选择商品进行竞价。
典型的网站有淘宝,拍拍网等
C2B(Consumer to Business)
C2B模式指的是消费者对企业,只是电子商务领域新出现的模式。
电子商务商业模式
店面模式
一个真实的电子商务站点,以某种价格提供产品或货物。它是一种典型的提供实际商品货物和服务的方式。商家直接把货发送给客户,销售中没有零销商或中介。
网络加传统模式
把站点和传统店面结合起来。它的优势是已经建立起了一个品牌可以用传统店面去宣传它的网站。如国美电器
按订单生产的商家模式
商家可以定制产品然后个性化地生产并送货给客户,为客户提供增值服务。
如DELL电脑
服务提供商模式
基于订阅的接入模式
许多服务运行商提供基于订阅的接入服务,用户每月或每年付固定的费用用来换取接入服务。
预付费接入模式
用户为一定时间段或一定内容的接入服务付一定金额的费用,还可以继续充值。预付费模式给用户在服务的花费方面以更大的控制权。
经纪人模式
经纪人是市场的创建者。作为中介,他们把买方和卖方凑在一起并鼓励他们交易,既可以是B2C和B2B市场也可以是C2C市场。经纪人通过其促成的每一笔交易或者按交易额的某百分比收取一定费用来赚钱。
广告商模式
站点提供没费的接入但在每一个页面上都有广告,用户在一条广告商点一下就能进入广告商的页面,广告商按广告的展示方式和展示面积付费,或按照广告的点击率付费。
门户站点模式
一个门户提供一站式的具体内容和服务的接入,门户网站可以更针对性地投放广告。如搜狐,网易,新浪,腾讯
免费接入模式
免费给用户一些东西,但是得看广告。如一些免费的Web空间提供商它们在站点的顶端和低端提供了广告标题。
虚拟商场模式
虚拟商场是许多商家,服务提供商,经纪人和其他企业的托管站点,虚拟商场的运行商以建立和维护商家的"摊位"和把商家编入站点目标而收取费用,也可以从商家成交的每一笔交易中收取费用。虚拟商场可以在更大型的站点内部运行。
虚拟社区模式
虚拟社区是一个吸引了网络上志同道合者一起组成的团体。用户分享信息,也以自己的方式贡献内容。这位公告提供了可能性,如开心网,天涯社区等。
信息中介模式
信息中介收集、评价客户及其购物行为等信息,并把它们出售给那些想要接近客户的其他人。最初,给访客免费提供一些信息,而信息中介则对访客的在线活动进行控制。收集的信息对市场营销有价值,它需要提供一些免费的信息吸引访客注册,收集大量对于针对性的广告活动由潜在价值的数据。
万维网
是一个资源空间,在这个空间中包含一些有用的事物,由一个"统一资源标识符URL"标识,这些通过超文本协议(HTTP)传送给使用者,而后者通过点击链接来获得资源。
在技术方面,万维网是软件、协议和标准的集合。
W3C 万维网联盟 MIT计算机科学实验室成立
域名的商业模式
转让域名
按点击付费:注册常用域名并提供广告链接服务
域名:Domain Name 用于在数据传输时标识计算机的电子方位。
DNS : Domain Name System,域名解析系统,它作为可以将域名和IP地址相互映射的一个分布式数据库,能够是用户更方便地访问互联网,而不用记得那些能够被机器直接读取的IP地址。
CN域名
CN域名为我国国家顶级域名,由工业和信息化部管理
CN域名注册管理机构为:中国互联网管理中心(CNNIC)
从地理范围分类,可以分为国际域名和国家域名
net |
互联网络、接入网络的信息中心(NIC)和运行中心(NOC) |
com |
工、商、金融等企业 |
edu |
教育机构 |
org |
各种非盈利性的组织 |
mil |
军事机构 |
ac |
科研机构 |
info |
提供信息服务的企业 |
…… |
cn |
中国 |
jp |
日本 |
us |
美国 |
de |
德国 |
uk |
英国 |
kr |
韩国 |
tw |
台湾 |
hk |
香港 |
从域名的级别进行分类,可分为顶级域名和二级域名
域名注册管理机构: ICANN,CNNIC
域名注册流程
域名备案
根据国家法律法规网站的所有者向国家有关部门申请的备案,主要有ICP备案和公安局备案两种。
ICP备案即网络内容服务商,英文名:Internet Content Provider,简写为ICP
网站空间(Web Host)又称为主机空间或虚拟主机,指存放网站内容的空间。
虚拟主机:把一台运行在互联网上的服务器划分为多个"虚拟"的服务器,每个虚拟主机都具有独立的域名和完整的Internet服务器功能。
双线接入:是指服务器所在的数据中心机房同时拥有网通与电信等多种网络出口,在机房的上层交换机设置了全网路由技术,使服务器每次向外部连接时可以自动分配到最快速的链路上。从而实现了电信与网通用户可以同时高速访问。
虚拟主机的优势
大幅降低费用(购买服务器、租用专线、维护费用等)
性能相对较好(合租服务器)
无需专门的维护人员和管理人员
常见主机服务:虚拟主机,独立主机,主机托管
服务器:一个管理资源并为用户提供服务的计算机,通常1分为文件服务器,数据库服务器和应用程序服务器。运行以上软件的计算机或计算机系统也称为服务器。
服务器分类(基于结构划分):塔式服务器,机架式服务器,刀片服务器。
塔式服务器(入门级服务器)
适用:服务器扩展、散热性能要求较高,采购数量不多,且空间比较冗余
优点:单个成本较低。由于机箱较大,具备良好的扩展能力和散热能力。可以配置多路处理器、多根内存、多块硬盘、多个冗余电源和散热风扇
缺点:机器重量(最重),空间占用率(最高)
机架式服务器(适用于资金较为充裕,针对性比较强的应用)
机柜:宽度为19英寸、高度以U为单位,1U=1.75英寸=44.5mm
优点:相对塔式服务器大大节省了空间占用,使布线,管理更为简洁。节省了机房的托管费用。随着技术的发展,有着不逊色于塔式服务器的性能。平衡了性能和空间。
缺点:由于机身的限制,在扩展能力和散热能力上不如塔式服务器。对制冷要求较高。需要对机架式服务器的体系结构专门进行设计,如主板、接口、散热系统等,设计成本较高,价格一般也高于塔式服务器。
刀片服务器
优点:扩展方便,支持热插拔。通过刀片架组成服务器集群,提供高速的网络服务。每个刀片不需要独立的电源、显示器、制冷装置,降低功耗,减少整体成本。
缺点:没有形成统一的标准,几大巨头互不兼容,导致用户选择的空间很狭窄
数据中心:又称为机房,网络中心,信息中心等,是实现数据收集、中转,集成、优化、共享和安全等硬件设备运行的场所,并向硬件设备提供正常的良好环境,对整个网络的运行起到了"心脏"作用。
组成:由网络硬件合支持硬件组成,网络硬件包括交换机、路由器、服务器、防火墙、UPS不间断电源等设备;支持硬件包括机房专用精密空调、机房环境及设备监控系统、防静电活动地板、防雷系统和防火、防水设备。
网络营销:以互联网为主要手段进行的、为达到一定营销目的的营销活动。
特点:电子时空的运作方式,平等自由的竞争环境,一对一的双向交互式沟通渠道,市场目标定位准确,减少中间环节,提高经营效率。
4Ps营销理论
产品(Product)、价格(Price)、渠道(Place)、促销(Promotion)
4Ps营销理论是以满足市场需求为目标的,重视产品导向而非消费者导向,代表的是企业立场而非客户立场。
4Cs营销理论
顾客(Customer)、成本(Cost)、便利(convenience)、沟通(Communication)
4Cs营销理论以消费者为导向
网络营销应用的是4Cs理论
病毒营销:又称为病毒式营销,是指利用网民的主动在线传播,让某个带有广告信息的咨询像病毒一样传播出去,从而达到网络营销的目的。并非以传播病毒的方式开展营销,而是通过用户的口碑宣传网络,信息像病毒一样传播。
论坛营销
论坛:即BBS(公告板服务)
优势:推广效果长久,营销费用低,受众基数大,影响面大,精确定位客户,互动性强,推广效果好,带来大量的外部链接
技巧:培养账号,与管理员保持良好关系,用长尾关键词做标题
博客营销
利用博客进行营销,它是企业利用博客这种特殊的交互性应用方式,发布企业信息,及时与客户沟通交流,开展市场活动的新型营销方式。
企业博客营销步骤:
第一步:确定博客营销的目的
第二步:选择合适的博客营销平台
第三步:确定博客营销的内容
第四步:确定博客写手类型
第五步:确定博客长期维护的计划
第六步:保持与客户的沟通互动
微博营销
微博营销以微博作为营销平台,每一个听众(粉丝)都是潜在营销对象,企业利用更新自己的微博向网友传播企业和产品信息,树立良好的企业形象和产品形象,从而达到营销目的。
微信营销
软文营销
所谓软文就是指通过特定的概念诉求,以摆事实讲道理的方式使消费者走进企业设定的"思维圈",以强有力的针对性心理攻击迅速实现产品的销售的文字模式
软文的五种形式
悬念式,故事式,恐吓式,情感式,促销式
邮件营销
邮件营销是指在用户实现允许的前提条件下,通过电子邮件方式向目标用户传递有价值的信息进行网络营销的一种手段,也称为"许可邮件营销"
搜索引擎:是根据一定的策略,运用特定的计算机程序收集互联网的上的信息,在对信息进行组织和处理后,并将处理后的信息显示给用户,是为用户提供检索服务的系统。
搜索引擎的分类
全文搜索引擎(百度,google)
全文搜索引擎的自动信息搜集功能分两种
一种是定期搜索
另一种是提交网站搜索
目录索引(Yahoo)
元搜索引擎(360综合搜索)
垂直搜索引擎
不同于通用的网页搜索引擎,垂直搜索专注于特定的搜索领域和搜索需求(例如:机票搜索,旅游搜索,生活搜索,小说搜索,视频搜索等等)垂直搜索需要的硬件成本低,用户需求特定,查询的方式多样。
抓取页面
每个独立的搜索引擎都有自己的网页抓取程序(spider,蜘蛛程序)。Spider顺着网页中的超链接,连续地抓取页面,被抓取的页面被称为网页快照。
处理页面
搜索引擎抓到页面后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件,其他还包括去除重复网页,分词(中文),判断网页类型,分析超链接,计算网页的重要度/丰富度。
提供检索服务
用户输入关键词进行检索,搜索引擎从索引数据库中找到匹配该关键词的网页。
搜索引擎一般由搜索器,索引器,检索器和用户接口四个部分组成
搜索器:其功能是在互联网中漫游,发现和搜集信息信息。
索引器:其功能是理解搜索器所搜索到的信息,从中抽取出索引项,用于表示文档以及生成文档库的索引表。
检索器:其功能是根据用户的查询在索引库中快速检索文档,进行相关度评价,对将要输出的结果排序,并能按用户的查询需求合理反馈信息。
用户接口:其作用是接纳用户查询,显示查询结果,提供个性化查询项。
搜索器
目前有两种搜集信息的策略
从一个起始URL集合开始,顺着这些URL中的超链接,以宽度优先、深度优先或启发式方式方式循环地在互联网中发现信息。这些起始URL可以是任意的URL,但常常是一些非常流行、包含很多链接的站点起点
将Web空间按照域名、IP地址或国家域名划分,每个搜索器负责一个子空间的穷尽搜索。
搜索器的实现常常使用分布式、并行计算技术。
索引项有客观索引项和内容索引项两种:客观项与文档的语意内容无关,如作者名,URL,更新时间,编码,长度,链接流行度等等;内容索引项是用来反映文档内容的,如关键词及其权重、短语、单词。
内容索引可以分为单索引项和多索引项(或称短语索引项)两种。
索引表一般使用某种形式的倒排表,即由索引项查找相应的文档
索引器可以使用集中式索引算法或分布式索引算法。
检索器
检索器的功能是根据用户的查询在索引库中快速检出文档,进行文档与查询的相关度评价,对将要输出的结果进行排序,并实现某种用户相关性反馈机制。
网络蜘蛛的简单模拟
第一步:通过蜘蛛抓取页面
第二步:网页文件处理
首先过滤所有HTML标签,CSS样式表、JS代码
第三步:识别文字内容
第四步:进行权重分值计算
所有搜索引擎最核心的是外部链接技术和关键词技术
第五步:存入排名数据库
搜索引擎优化(SEO)
SEO(Search Engine Optimization)搜索引擎优化,就是针对搜索引擎对网页的检索特点,让网站建设的各项基本要素适合搜索引擎的检索原则,从而使搜索引擎收录本网站尽可能多的网页,并且在搜索引擎自然检索结果中排名靠前,最终达到网站推广的目的。
SEO的主要工作是通过了解各类搜索引擎如何抓取互联网页面如何进行索引以及如何确定其对某一特定关键词的搜索排名等技术,来对网页内容进行相关的优化,使其符合用户浏览习惯,在不损害用户体验的情况下提高搜索引擎排名,从而提高网站访问量,最终提升网站的销售能力或宣传能力。
PR:网页级别,Page Rank 是Google衡量网页重要性的工具。Page Rank代表的是重要性和受欢迎程度。Page Rank和排名没有直接关系,因为它没有相关性。
PV:PV是用户访问网站时所浏览的总网页数。平均PV值实际上从侧面反映出一个网站的用户粘性,即网站受欢迎程度。
百度快照:百度快照其实就是百度蜘蛛爬取网页内容时,将网页文本内容独立创建一个文本文件,保存在百度数据库中的网页的"照片"
SEO黑帽:简单来说,SEO黑帽就是采用了搜索引擎所禁止的方法(作弊),对网站的搜索引擎的排名进行优化,在短时间内排到搜索引擎前列。
SEO白帽:白帽所指的是采用合理的SEO行为优化网站,提高用户的体验,合理与其他网站互联,从而达到网站在搜索排名的稳步提升。
跳出率:跳出率是指到网站只浏览一个页面就离开的用户占网站总浏览用户的百分比
沙盒效应:指一个新建的网站在刚上线的一个或几个月内,在搜索引擎上很难友好的排名,甚至没有排名。
Google Dance:指Google搜索引擎数据库每月一次的大规模升级
长尾理论:由于成本和效率的因素,当商品储存流通展示的场地和渠道足宽广、商品生产成本急剧下降以至于个人都可以进行生产、并且商品的销售成本急剧降低时,几乎任何以前看似需求需求极低的产品,只要有卖,都会有人买。
长尾关键词:网站上非目标关键词但也可以带来搜索流量的关键词称为长尾关键词。
目标关键词:是指经过关键词分析确定下来的网站"主打"关键词。通俗地讲指,网站产品和服务的目标客户可能用来搜索的关键词。
相关关键词:与目标关键词相关的其他关键词
SPAM:在搜索引擎中的SPAM是指专门针对那些欺骗搜索引擎的技术。
搜索引擎收录查询: site:网址
SEO常用技术
网页title的优化:关键词由小到大,由细到粗,将整个网页的内容都毫无保留地描述在title中。关键词分割符,如果要单独优化百度或其他国内搜索引擎,就使用下划线"_"来分割title关键词。如果优化Google或者其他国外的搜索引擎,就采取用横杆"-"作为分割符。不能超过255个字符
关键词的选取:关键词不要太宽广。长尾关键词并不是很长的关键词(意义要精确)。多考选择竞争较小,但实际关注度高的关键词。关键词和网站一定要有关系。关键词一般要确定两三个就可以了。
关键词的优化:关键词之间以英文的逗号(,)分隔。元标签。关键词密度是指一个网页中某个词与所有文本之间的比例。一般情况下,中文网页的关键词密度应该控制在2%-8%之间。
元标签及网页描述的优化
all:不拒绝任何蜘蛛的抓取行为
noindex:不索引当前页面
index:索引当页面
nofollow:不追踪当前页面的链接
follow:追踪当前页面的链接
noarchive:在搜索结果中不采用当前页面的快照
archive:在搜索结果中保存当前页面的快照
nosnippet:不采用头部描述信息,不保存页面快照
none:不索引当前页面以及当前页面的所有链接
eg:后台 noindex ,留言板 nofollow
描述最好用一句话来概括本网页的主题内容,使用英文的标点符号
网站结构和URL优化
尽量不要有?一类的参数,三层目录是最为合适的,采取伪静态或直接生成静态页面。域名必要时可以叫横杠
robots.txt文件
User-agent: *
Disallow:
或者
User-agent: *
Allow: /
允许所有搜索引擎访问所有内容
User-agent: *
Disallow: /
禁止所有搜索引擎访问所有内容
User-agent: *
Disallow: /admin/*.html
通配符*的使用,如title.html,uml.html
User-agent: *
Allow: .asp$
Disallow: /
通配符$的使用,允许访问所有以asp为后缀的文件
网页链接优化
网站导航尽量使用文本形式来作为链接的锚文字
网站地图sitemap
图片导航添加alt属性
面包屑导航:可以获得大量的来自内容页面的反向链接,提高了网站内部链接的紧密性,精确反应上级页面的内容
采用固定关键词的专题策略
文章内容的引用链接
相关文章的链接优化
外部链接的优化
高权重的网站
同行业的网站
Heading标签的优化
蜘蛛在爬行过程中,首先会通过链接向该网页的链接锚文字获取"第一印象",以大致判断该网页的内容。然后查询网页title标签的内容,以确认刚才查看锚文本的判断是否正确。第三步就是网页的h1标签,h1标签作为整个网页的内容标题,可以概括整个页面的内容。蜘蛛会以h1的内容作为参考对网页本身进行分类。
在每个页面只需要放置一个h1标签,h2标签不能太多,一般不能超过3个。H3-h6标签不能太频繁。
图片优化
JPG>JPEG>GIF>PNG>BMP
通过HTML代码中的元素提高图片与关键词之间的相关度
通过URL链接来提高图片与关键词的相关度
文件名,URL文件夹名称,环绕图片的文字
SEO常用作弊方式
乔页:又称为过渡页,通常是用软件自动生成大量包含关键词的网页,然后从这些网页做自动转向到主页。
关键词堆砌
隐藏文字
隐藏链接:把关键词放在链接里面,而这个链接也是用户看不到的
隐藏页面:用户和搜索引擎看到是不一样的
细微文字
电子商务与数据挖掘
DataàInformationàKnowledge
频繁项集:频繁地同时出现在交易数据集中的商品,例如啤酒和尿布、牛奶和面包等的集合
序列模式:如果这些商品构成一个序列(例如先买手机à再买保护套à再买移动电源等)则称为(频繁)序列模式
数据挖掘:从大量数据中去找其规律的技术,是统计学,数据库和人工智能等技术的综合,是从大量的,不完全的,有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的,人们事先不知道的、但又是潜在的有用信息和知识的过程。
数据挖掘的四大核心任务:关联分析,分类与预测,聚类分析,异常检测
关联分析:某种事物发生时其他事物也会发生,这种联系称之为关联,是指两个或多个变量取值之间存在一类重要的可被发现某种规律性。
分类:用于预测离散的目标变量,通过分析一个类别已知的数据集的特征来建立一组模型,该模型可用以预测类别未知的数据项的类别,主要方法包括分类规则,决策树,贝叶斯分类,人工神经网络,支持向量机等。
预测:用于预测连续的目标变量,预测也是首先构建模型,再通过模型来预测未知值,主要方法是回归,包括线性回归,多元回归和非线性回归等。
分类预测的是类别,而非连续的值
分类的目的:获取分类函数或分类模型(或分类器),该模型能把数据库中的数据项映射都某一个指定类别
分类可用于提取描述重要数据类的模型或预测未来的数据趋势。
两个步骤:创建模型,使用模型
聚类分析:无监督的分类,是指把一组数据分成不同的"簇",每簇中的数据相似而不同簇间的数据则距离较远,
特点:一种无监督分类法,没有预先指定的类别