小雁子学Python

Python爬虫实战，requests模块，Python实现IMDB电影top数据可视化

前言

利用Python爬取IMDB电影。废话不多说。

让我们愉快地开始吧~

开发工具

Python版本： 3.6.4

相关模块：

requests模块；

random模块；

bs4模块；

以及一些Python自带的模块。

环境搭建

安装Python并添加到环境变量，pip安装需要的相关模块即可。

一来豆瓣作为爬虫入门，各种大牛的深入分析已趋于完美；另一方面随着中国电影工业的发展，我们需要将视角转向国际市场，通过数据分析，了解一下外国人比较感兴趣的电影。

思路分析

IMDB top250主页

IMDB电影详情页 (1)

IMDB 电影详情页 (2)

基于以上网页构造，我们发现只需得到每个电影的详情页编码(唯一)，通过2次“蛙跳”，实现详情页(1)(2)导出国家&类型，分数&人数的信息的获取。便于理解，爬取思维导图如下：

爬虫代码

IMDB top250主页

#导入库-------------------------------------------
from urllib import request
from chardet import detect
from bs4 import BeautifulSoup
import pandas as pd
import time
import random

#获取网页源码，生成soup对象-------------------------
def getSoup(url):
    with request.urlopen(url) as fp:
       byt = fp.read()
       det = detect(byt)
       time.sleep(random.randrange(1,5))
       return BeautifulSoup(byt.decode(det['encoding']),'lxml')
   
#解析数据-------------------------------------------  
def getData(soup):
   #获取评分
   ol = soup.find('tbody', attrs = {'class': 'lister-list'})
   score_info = ol.find_all('td',attrs={'class':'imdbRating'})
   film_scores = [k.text.replace('\n','') for k in score_info]
   #获取评分、电影名、导演・演员、上映年份、详情网页链接
   film_info = ol.find_all('td',attrs={'class':'titleColumn'})
   film_names =  [k.find('a').text for k in film_info]
   film_actors =  [k.find('a').attrs['title'] for k in film_info]
   film_years = [k.find('span').text[1:5] for k in film_info]
   next_nurl =  [url2 + k.find('a').attrs['href'][0:17]  for k in film_info]
   data=pd.DataFrame({'name':film_names,'year':film_years,'score':film_scores,'actors':film_actors,'newurl':next_nurl})      
   return data

IMDB top250电影详情页

#获取详情页数据-------------------------------------------
def nextUrl(detail,detail1):
  #获取电影国家
  detail_list = detail.find('div',attrs={'id':'titleDetails'}).find_all('div',attrs={'class':'txt-block'})
  detail_str = [k.text.replace('\n','') for k in detail_list]
  detail_str = [k for k in detail_str if k.find(':')>=0]
  detail_dict = {k.split(':')[0] : k.split(':')[1] for k in detail_str}
  country = detail_dict['Country']    
  #获取电影类型
  detail_list1 = detail.find('div',attrs={'class':'title_wrapper'}).find_all('div',attrs={'class':'subtext'})
  detail_str1 = [k.find('a').text for k in detail_list1]
  movie_type=pd.DataFrame({'Type':detail_str1})
  #获取以组划分的电影详细评分、人数
  div_list = detail1.find_all('td',attrs= {'align': 'center'})
  value = [k.find('div',attrs= {'class': 'bigcell'}).text.strip() for k in div_list]
  num   = [k.find('div', attrs={'class': 'smallcell'}).text.strip() for k in div_list]
  scores=pd.DataFrame({'value':value,'num':num})  
  return country,movie_type,scores

结果展示

数据分析

影片类型对比

首先来看一下各个类型的影片占比：

Top250电影的类型占比，前三名分别是喜剧、犯罪与动作。

紧张刺激的情绪、张弛有度的情节，最能带给影迷带来记忆深刻的观影体验。

下面再来看下各个类型的影片的得分对比

从类型来看，西部片一骑绝尘，究其原因可能与受众人群小、爱好者狂野奔的性格易给高分有关。其次，犯罪、动作、冒险、推理、恐怖题材也易出较高评分

年份对比

首先我们看下TOP250电影的所属年份

Top250电影中，1957、1995、与2014年电影较多，而1975年后，上榜电影有明显增加的趋势，这可能与电影工业的日趋成熟有关。

至于1995年，熟悉电影的小伙伴可能知道，1995年是世界电影100周年，无数电影天才抱着献礼的想法，在这一年诞生了他们伟大的作品，我们较为熟悉的有《肖申克救赎》、《阿甘正传》、《低俗小说》、《四个婚礼与一个葬礼》、《七宗罪》、《狮子王》等。

同时我们看下各个年份电影的评价分数

比较电影年代评分，并无发现明显上升或下降趋势，可见电影艺术并不会随时间而失去自身价值。对于电影，技术不是第一位的，感情共鸣的因素占更大权重；哪部电影最好看？答案就在我们每个人心中。

国家对比

我们看下各个国家及地区在TOP250电影中的占比情况

这个数据比较有趣，有点像诺贝尔奖，美国电影占据半壁江山，其余国家瓜分剩下的蛋糕。排名前几位的分别是英国、法国、日本、德国。而中国，唯一上榜的电影只有一部——《花样年华》。

如果是西方主流价值观的原因，同样作为东方文化代表的邻国日本，却有16部电影上榜，可见西方价值观并不能成为中国电影上榜少的主要原因。虽然近几年中国不乏有《大鱼海棠》、以及刚最新上映的《流浪地球》这样高质量的作品上线，但是在国际市场仍反响平平。我相信电影是有共同语言的，也真的有普世价值观这样的东西。如何打造国际化电影工业，给世界人民讲故事，是中国电影人接下来需要探索的课题。

导演对比

我们一起看下那些在TOP250榜单中，最常出现的导演们

电影界的诺贝尔开奖啦，一起来看看有哪些作者上榜。鉴于大家对外国导演名可能不太熟悉，这里做了一个导演-代表作做对照表，值得注意的是，雷德利・斯科特、詹姆斯・卡梅隆、大卫・芬奇分别执导了电影《异形1》《异形2》《异形3》，一部《异形》出3个上榜导演，可见其系列影响力。

人群对比

首先我们看下不同人群的评分情况

从性别维度来看，男性比女性给容易给出高分。另一方面，从年龄段侧看，无论男女，未成年人员最易给出高分，随着年龄增加，评分愈加犀（è）利（dú），超过45岁的人群，给出的分数是最低的。是否历经沧海，坚硬的心就越难被打动？又或许见多识广，才能公正客观的评价一部电影？也许可以就此问题研究一下，如《电影节评委年龄层的科学配置方法》。

然而知道了评分情况，我们也需要去了解下各类人群的占比情况

虽然“老叔叔”、”老阿姨”们的评分偏低，但是一部电影的口碑高低不用太担心这类人群。因为数据告诉我们，满足30-44以及18-29这两个年龄段的中青年男性口味，电影口碑肯定差不了。从近些年《战狼》、《红海行动》，这类战争动作片均取得不错的口碑中，对评分机制可略知一二。

类型、年龄与评分的关系

首先我们用热力图来看下各个人群对不同类型电影的评分情况

不同年龄群，对电影类型的偏好是不同的。如未成年男性、女性，对推理、西部片表现出浓厚兴趣，而45以上的男性、女性，分别对科幻、黑色电影类型钟爱。

评分的高低也需要结合占比进行综合分析

这次我们将数据粒度细化至各年龄层，结合各年龄段评分，以下我们给出各年龄层在TOP250榜中的推荐电影。

电影推荐

未成年男性（<18）

18-29岁男性

30-44岁男性

45+男性

未成年女性(<18）

18-29岁女性

30-44岁女性

45+女性

以上是根据IMDBtop250数据推荐的电影，如果有不符合的情况，在这里说声抱歉。毕竟美国人民的喜好和中国还是有一定区别的。

你可能感兴趣的:(Python技术分享,python爬虫,requests,豆瓣影评,数据可视化,IMDB)

Html、Markdown的信息提取 DreamBoy_W.W.Y 知识图谱 python
目录一、前言二、核心代码1、解析提取html文档2、提取Markdown文档信息一、前言【python】mistune转换md为HTML，BeautifulSoup解析读取。【python】Html文档，使用BeautifulSoup解析读取。二、核心代码1、解析提取html文档defextract_all_content(soup):content={'text':[]
Python实战：解析labelme标注数据——如何将数据转换为COCO格式程序员杨弋 Python全栈工程师学习指南 python 开发语言
在计算机视觉中，标注数据是非常重要的，而Labelme是一个简单易用的自由标注工具，被广泛应用于图像语义分割、目标检测、实例分割等领域，然而标注数据并不总是以我们需要的格式存在，因此需要进行适当的转换，本文将详细介绍如何将Labelme标注数据转换为COCO格式。首先需要安装相关的Python库，包括labelme、numpy、matplotlib、pillow等，在安装完成后设置数据路径，并读取
python运行路径和脚本文件所在路径 Wiseehw Python
我在sublimeText2编辑python脚本程序，用ipython导入脚本模块，打开文件时总是报错，原来是路径问题deffile2matrix(filename):fp=open(filename,'r')datalines=fp.readlines()lenlines=len(datalines)dataSet=np.zeros((lenlines,3))labels=[]index=0fo
揭秘！100 个 Python 常用易错知识点的避坑指南 tekin Python python Python 易错点 Python 编程避坑 Python 知识总结 Python 基础与进阶 Python 代码优化 Python 常见错误解析
目录简介1.类方法命名中的下划线2.函数形参中的*和**3.函数实参中的*4.变量作用域5.浅拷贝和深拷贝6.默认参数的陷阱7.迭代器和生成器相关迭代器使用后耗尽生成器表达式和列表推导式混淆8.异常处理相关捕获异常范围过大异常处理中的finally子句9.多线程和多进程相关全局解释器锁（GIL）误解多线程性能提升多进程中的资源共享问题10.字符串编码问题编码和解码错误11.模块导入相关循环导入问题
Deepseek与doubao|tongyi|wenxin三个大模型对比编写数据处理脚本 AI技术老狗（QA） Deepseek 大模型 AI编写脚本
‌DeepSeek在编写脚本方面的能力非常强大，尤其在编程、推理和数学计算方面展现出了超越普通AI的能力‌。DeepSeek的核心优势在于其编程能力的显著提高，能够轻松应对前端脚本和后端逻辑的编写，大大降低了程序员编写代码的难度。今天我们就对比下deepseek、豆包、通义千问、文心一言这四个进行一下对比，对比的题目为：《帮我写一个处理excel数据的python脚本，要求：100万条数据，去除重
python工作目录与文件目录我家大宝最可爱 python 开发语言
总结open函数中的相对路径是以工作目录为基准的import导入package时，相对路径是以当前执行import的文件路径为基准的由于python规定顶层模块不能作为package，因此import只能导入当前文件所在的目录以及子路下的package，无法导入上层目录的pakcage，例如import..xxx是不行的，只能是importx或者importx.y想要导入上层目录的package，
logging 日志同时输出到控制台（踩坑：python2 vs python3使用差异) freesonWANG 入门 python logging
一段python3生效的代码：importloggingforhandlerinlogging.root.handlers[:]:logging.root.removeHandler(handler)logging.basicConfig(level=logging.DEBUG,format=
踩坑记录: Python的工作路径(working dircetory) neowell 个人笔记 python 开发语言
本部分不涉及模块搜索方式的具体解释,有兴趣可以看看我之前的笔记:Python中令人困惑的模块导入.问题描述项目简介首先给出一个简单的项目结构:root└──random_dir├──random_file.py└──text_file.txtroot是项目的根目录,旗下只有一个名为random_dir的文件夹,在这个文件夹内,有一个python的脚本文件random_file.py,以及一份空的文
Github 2024-06-20 开源项目日报 Top10 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2024-06-20统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目4TypeScript项目4Rust项目2JavaScript项目1Dart项目1Java项目1Go项目1RustDesk:用Rust编写的开源远程桌面软件创建周期：1218天开发语言：Rust,Dart协议类型：GNUAfferoG
不安装python怎么运行py_如何不用安装python就可以运行.py文件？ weixin_39632471 不安装python怎么运行py
解决这个问题的便携版的python不能直接运行py文件。解决这个问题的便携版的python不能直接运行py文件。协会:直接运行.py文件没有windows下的一个前缀。协会:python的便携版的问题不能直接运行python脚本。直接运行py文件\u2026为了方便部署,您需要编译Python源代码到一个可执行文件,和编译后的可执行文件可以运行的Python环境。你好!这是你第一次使用欢迎页面显示
python引用其他文件提示找不到模块_命令行执行python模块时提示ImportError: No module named xxx... weixin_39644146
在pycharm中运行python文件没有问题，切换到cmd中是提示：ImportError:Nomodulenamedxxx原因：pycharm在运行时会把当前工程的所有文件夹路径都作为包的搜索路径，而命令行默认只是搜索当前路径。’解决方法：在出错的模块中加上importsysimportoscurPath=os.path.abspath(os.path.dirname(__file__))ro
python3 + selenium webdriver自动化测试启动不同浏览器 cs_mengxi selenium Web自动化 selenium 测试工具
seleniumwebdriver自动化测试启动不同浏览器seleniumwebdriver介绍SeleniumWebDriver进行自动化测试的一般流程浏览器驱动下载浏览器驱动的安装chrome、edge、Firefox、Opera、Safari、phantomjs应用HeadlessChrome、HeadlessFirefox应用seleniumwebdriver介绍SeleniumWebDr
通过命令行运行py文件与通过ide运行py文件，对文件中模块的引用方式的影响 yaoshengting python python
通过命令行运行Python文件和通过IDE运行Python文件时，模块的引用方式会受到一些影响，主要体现在工作目录和模块导入路径（sys.path）的设置上。下面详细介绍这两种方式的区别和它们如何影响模块引用。1.通过命令行运行Python文件当你通过命令行运行Python文件时，Python会根据你在命令行中指定的路径来查找模块。通常情况下，当前工作目录（即你运行Python命令的目录）会被添加
Python删除文件与文件夹：remove()、rmdir() 大数据张老师 Python程序设计 python 开发语言运维
Python删除文件与文件夹：remove()、rmdir()在文件和目录管理中，删除操作是非常重要的一部分。Python提供了os模块中的remove()和rmdir()方法来删除文件和文件夹。本节将详细讲解这两个方法的用法、注意事项以及它们的适用场景，帮助读者准确掌握删除文件与文件夹的操作。1.删除文件：os.remove()os.remove()方法用于删除指定路径的文件。当路径对应的目标为
python中datetime模块时间的使用幸运的星竹 Python python 开发语言
python中，有两个模块用来表示时间，一个是time模块，一个是datetime模块。之前我们讲述过time模块怎么使用时间，这篇我们看下datetime模块怎么表达时间。datetime类型是一个比较综合的类型，它下面有子包datetime.date专门用来表示日期，datetime.time专门用来表示时间，而datetime.datetime就表示日期时间，其中还有datetime.dat
python中os的常用方法神即道道法自然如来 python python
os.path常用方法：os.getcwd()获取当前工作目录，即当前python脚本工作的目录路径os.chdir("dirname")改变当前脚本工作目录；相当于shell下cdos.curdir返回当前目录:('.')os.pardir获取当前目录的父目录字符串名：('..')os.makedirs('dirname1/dirname2')可生成多层递归目录os.removedirs('di
python字符串怎么转换成字典_用python将字符串转换成字典 weixin_39777018
Iknowthatthisquestionsoundaduplicate,butit'snot,atleastlookedforawhileandIcouldn'tfinenothingformyspecificproblem.Ihavethefollowingstring:"{first:{name:'test',value:100},second:{name:'test2',value:50}
Python里的OS模块常用函数说明 weixin_34050389 python 操作系统 shell
Python的标准库中的os模块包含普遍的操作系统功能。如果你希望你的程序能够与平台无关的话，这个模块是尤为重要的。即它允许一个程序在编写后不需要任何改动，也不会发生任何问题，就可以在Linux和Windows下运行。下面列出了一些在os模块中比较有用的部分。它们中的大多数都简单明了。os.sep可以取代操作系统特定的路径分隔符。windows下为“\\”os.name字符串指示你正在使用的平台。
python-将字符串转换为字典 weixin_30505751 python json
json越来越流行，通过python获取到json格式的字符串后，可以通过eval函数转换成dict格式：>>>a='{"name":"yct","age":10}'>>>eval(a){'age':10,'name':'yct'}转载于:https://www.cnblogs.com/gy-ph/p/8087372.html
Python调用C语言动态库（DLL）结构体/指针/变量的方法 ENOCH_Q PYTHON python c语言开发语言
文章目录前言一、如何生成C语言动态库DLL第一步：安装编译工具第二步：设计C代码第三步：编译成C语言动态库DLL二、如何使用C语言动态库第一步：python/pytorch调入DLL接口第二步：Python调用DLL函数第三步：Python测试函数三、完整程序与测试结果总结前言在使用python等进行数据处理时，有时需要使用C语言生成的动态库进行数据处理，比如有些算法已经用C语言实现，或有些函数处
使用Python引用DLL文件的方法 NoABug python microsoft 开发语言 Python
Python是一种功能强大的编程语言，可以与其他编程语言和库进行交互。在某些情况下，您可能需要使用Python引用动态链接库（DLL）文件，以便在Python代码中调用DLL文件中的函数和方法。本文将介绍如何使用Python引用DLL文件并调用其中的函数。步骤1：准备DLL文件首先，您需要准备一个DLL文件，该文件包含您要在Python中调用的函数和方法。您可以通过自己编写DLL文件，或者使用第三
在Python 中字符串转换为字典 Yuº Python python
在Python中把字符串转换为字典例如，将字符串user_info=‘{“name”:“john”,“gender”:“male”,“age”:28}’转换为字典user_dict={“name”:“john”,“gender”:“male”,“age”:28}有以下几种方法1.通过json来转换importjsonuser_info='{"name":"john","gender":"male"
Python实现AWS Fargate自动化部署系统 ivwdcwso 运维开发 python aws 自动化 ecs 开发 Fargate 运维
一、背景介绍在现代云原生应用开发中,自动化部署是提高开发效率和保证部署质量的关键。AWSFargate作为一项无服务器计算引擎,可以让我们专注于应用程序开发而无需管理底层基础设施。本文将详细介绍如何使用Python实现AWSFargate的完整自动化部署流程。©ivwdcwso(ID:u012172506)二、技术栈选择Python3.8+:作为主要开发语言boto3:AWS官方PythonSDK
小程序二：利用Python编写一个简单的计算器（实现加减乘除）嘵奇 Python小程序 python
![在这里插入图片描述](https://img-blog.csdnimg.cn/20210515164416507.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxNDc5ODUwNTgx,size_16,color_FFFFFF,t
Elasticsearch和Kibana的安装部署及服务器配置 TpCode elasticsearch 服务器大数据
Elasticsearch和Kibana是一对强大的工具，用于搜索、分析和可视化大规模数据集。Elasticsearch是一个开源的分布式搜索和分析引擎，而Kibana是一个用于数据可视化的开源工具。本文将详细介绍如何安装、部署和配置Elasticsearch和Kibana，并在服务器上运行它们。步骤1：安装JavaElasticsearch和Kibibana都需要Java来运行。确保您的服务器上
【愚公系列】《Python网络爬虫从入门到精通》012-字符串处理愚公搬代码愚公系列-书籍专栏 python 爬虫开发语言
标题详情作者简介愚公搬代码头衔华为云特约编辑，华为云云享专家，华为开发者专家，华为产品云测专家，CSDN博客专家，CSDN商业化专家，阿里云专家博主，阿里云签约作者，腾讯云优秀博主，腾讯云内容共创官，掘金优秀博主，亚马逊技领云博主，51CTO博客专家等。近期荣誉2022年度博客之星TOP2，2023年度博客之星TOP2，2022年华为云十佳博主，2023年华为云十佳博主，2024年华为云十佳博主等
Python 实现 2025 专属烟花效果粒子 Clevermea python 开发语言 pygame 算法逻辑回归推荐算法
引言“爆竹声中一岁除”，听到这句话，想必大家都不陌生吧。在城市中看到那拖着彩星的烟花飞向天空，在空中绽放出来，那一刻是多么美好。那么，话说回来，你是否想过用代码的力量，在虚拟世界中重现这绚烂的烟花场景呢？借助Python强大的绘图和动画库，我们完全可以实现这一有趣的创意，为2025年增添一份独特的科技感与浪漫氛围。准备工作在开始编码之前，我们需要安装一些必要的Python库。这里我们会用到pyga
AWS上基于高德API验证Amazon Redshift里国内地址数据正确性的设计方案 weixin_30777913 python 数据仓库云计算 aws
该方案通过无服务架构实现高可扩展性，结合分页查询和批量更新确保高效处理海量数据，同时通过密钥托管和错误重试机制保障安全性及可靠性。一、技术栈组件技术选型说明计算层AWSLambda无服务器执行，适合事件驱动、按需处理，成本低数据存储AmazonRedshift存储原始地址数据及验证结果API调用高德地理编码API提供地址标准化及验证能力开发语言Python3.9+使用requests处理HTTP请
deepseek+python,离线api，持续对话守着黎明看日出 python
功能：通过start开启新对话，stop结束对话，exit退出程序，并且可持续对话代码fromtransformersimportAutoModelForCausalLM,AutoTokenizer,BitsAndBytesConfigimporttorch#导入torch模块#配置4-bit量化quantization_config=BitsAndBytesConfig(load_in_4bit
文档比对工具/Word查重（基于python的本地word文档查重）二筠贝 windows python 开发语言
本地文档查重一本地文档查重二代码思路使用第本地文档查重一的基本思路。根据自己的需求去自定义一些函数1.自定义一个读取对比word文件名的函数。2.自定义一个根据文件名读取word内容函数，并将内容转换为list.3.自定义对比的方法。4.主函数去调用上面的方法，并采用多进程方式。多进程/多线程本文章在测试下述代码时，也曾经采用多线程（threading.Thread）方式，但感觉未展现多线程的优势
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，Django@Python2.x 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他