Python新世界

Python微医挂号网医生数据抓取

1. 写在前面

今天要抓取的一个网站叫做微医网站，地址为 https://www.guahao.com ，我们将通过python3爬虫抓取这个网址，然后数据存储到CSV里面，为后面的一些分析类的教程做准备。本篇文章主要使用的库为pyppeteer 和 pyquery

首先找到医生列表页

https://www.guahao.com/expert/all/全国/all/不限/p5

这个页面显示有 75952 条数据，实际测试中，翻页到第38页，数据就加载不出来了，目测后台程序猿没有把数据返回，不过为了学习，我们忍了。

2. 页面URL

https://www.guahao.com/expert/all/全国/all/不限/p1
https://www.guahao.com/expert/all/全国/all/不限/p2
...
https://www.guahao.com/expert/all/全国/all/不限/p38

数据总过38页，量不是很大，咱只需要随便选择一个库抓取就行，这篇博客，我找了一个冷门的库
pyppeteer 在使用过程中，发现资料好少，很尴尬。而且官方的文档写的也不好，有兴趣的可以自行去看看。关于这个库的安装也在下面的网址中。

https://miyakogi.github.io/pyppeteer/index.html

最简单的使用方法，在官方文档中也简单的写了一下，如下，可以把一个网页直接保存为一张图片。

import asyncio
from pyppeteer import launch
async def main():
  browser = await launch() # 运行一个无头的浏览器
  page = await browser.newPage() # 打开一个选项卡
  await page.goto('http://www.baidu.com') # 加载一个页面
  await page.screenshot({'path': 'baidu.png'}) # 把网页生成截图
  await browser.close()
asyncio.get_event_loop().run_until_complete(main()) # 异步

我整理了下面的一些参考代码，你可以做一些参考。

browser = await launch(headless=False) # 可以打开浏览器
await page.click('#login_user') # 点击一个按钮
await page.type('#login_user', 'admin') # 输入内容
await page.click('#password') 
await page.type('#password', '123456')
await page.click('#login-submit')
await page.waitForNavigation() 
# 设置浏览器窗口大小
await page.setViewport({
  'width': 1350,
  'height': 850
})
content = await page.content() # 获取网页内容
cookies = await page.cookies() # 获取网页cookies

3. 爬取页面

运行下面的代码，你就可以看到控制台不断的打印网页的源码，只要获取到源码，就可以进行后面的解析与保存数据了。如果出现控制不输出任何东西的情况，那么请把下面的

await launch(headless=True) 修改为 await launch(headless=False)

import asyncio
from pyppeteer import launch
class DoctorSpider(object):
  async def main(self, num):
    try:
      browser = await launch(headless=True)
      page = await browser.newPage()
      print(f"正在爬取第 {num} 页面")
      await page.goto("https://www.guahao.com/expert/all/全国/all/不限/p{}".format(num))
      content = await page.content()
      print(content)
    except Exception as e:
      print(e.args)
    finally:
      num += 1
      await browser.close()
      await self.main(num)
  def run(self):
    loop = asyncio.get_event_loop()
    asyncio.get_event_loop().run_until_complete(self.main(1))
if __name__ == '__main__':
  doctor = DoctorSpider()
  doctor.run()

4. 解析数据

解析数据采用的是pyquery ，这个库在之前的博客中有过使用，直接应用到案例中即可。最终产生的数据通过pandas保存到CSV文件中。

import asyncio
from pyppeteer import launch
from pyquery import PyQuery as pq
import pandas as pd # 保存csv文件
class DoctorSpider(object):
  def __init__(self):
    self._data = list()
  async def main(self,num):
    try:
      browser = await launch(headless=True)
      page = await browser.newPage()
      print(f"正在爬取第 {num} 页面")
      await page.goto("https://www.guahao.com/expert/all/全国/all/不限/p{}".format(num))
      content = await page.content()
      self.parse_html(content)
      print("正在存储数据....")
      data = pd.DataFrame(self._data)
      data.to_csv("微医数据.csv", encoding='utf_8_sig')
    except Exception as e:
      print(e.args)
    finally:
      num+=1
      await browser.close()
      await self.main(num)
  def parse_html(self,content):
    doc = pq(content)
    items = doc(".g-doctor-item").items()
    for item in items:
      #doctor_name = item.find(".seo-anchor-text").text()
      name_level = item.find(".g-doc-baseinfo>dl>dt").text() # 姓名和级别
      department = item.find(".g-doc-baseinfo>dl>dd>p:eq(0)").text() # 科室
      address = item.find(".g-doc-baseinfo>dl>dd>p:eq(1)").text() # 医院地址
      star = item.find(".star-count em").text() # 评分
      inquisition = item.find(".star-count i").text() # 问诊量
      expert_team = item.find(".expert-team").text() # 专家团队
      service_price_img = item.find(".service-name:eq(0)>.fee").text()
      service_price_video = item.find(".service-name:eq(1)>.fee").text()
      one_data = {
        "name": name_level.split(" ")[0],
        "level": name_level.split(" ")[1],
        "department": department,
        "address": address,
        "star": star,
        "inquisition": inquisition,
        "expert_team": expert_team,
        "service_price_img": service_price_img,
        "service_price_video": service_price_video
      }
      self._data.append(one_data)
  def run(self):
    loop = asyncio.get_event_loop()
    asyncio.get_event_loop().run_until_complete(self.main(1))
if __name__ == '__main__':
  doctor = DoctorSpider()
  doctor.run()

总结一下，这个库不怎么好用，可能之前没有细细的研究过，感觉一般，你可以在多尝试一下，看一下是否可以把整体的效率提高上去。

数据清单：

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对脚本之家的支持。如果你想了解更多相关内容请查看下面相关链接

你可能感兴趣的:(Python微医挂号网医生数据抓取)

DeepSeek 在 Windows 环境下的具体部署步骤及常见问题解决方案 Python测试之道 python 测试提效人工智能 python
DeepSeek是一个开源的智能语义搜索框架，其本地部署可以帮助企业或个人在保证数据隐私的前提下实现快速搜索和检索。以下是针对Windows环境的具体部署步骤以及常见问题的解决方法。一、部署环境要求在Windows环境下部署DeepSeek，需要具备以下条件：1.系统要求Windows10或更高版本64位操作系统2.必备软件Python：推荐Python3.8或以上版本（确保安装时勾选“添加到PA
Rockchip RK3588 Linux SDK 快速入门撸一串代码 RK3588 平台从入门到精通 linux 驱动开发
RockchipRK3588LinuxSDK快速入门目录文章目录RockchipRK3588LinuxSDK快速入门@[toc]1.SDK预编译镜像2.开发环境搭建准备开发环境安装库和工具集检查和升级主机的`python`版本检查和升级主机的`make`版本检查和升级主机的`lz4`版本3.Docker环境搭建4.软件开发指南开发向导芯片资料Buildroot开发指南Debian开发指南第三方OS
基于深度学习YOLOv8的海洋动物检测系统（Python+PySide6界面+训练代码）深度学习&目标检测实战项目深度学习 YOLO python 目标检测人工智能开发语言
引言近年来，计算机视觉技术在各行各业中得到了广泛的应用，特别是在智能监控、自动驾驶、医疗诊断等领域。深度学习，尤其是卷积神经网络（CNN）的出现，极大地提高了计算机处理图像和视频的能力。在这一领域，YOLO（YouOnlyLookOnce）系列模型以其高效且准确的目标检测能力，成为了当下最为流行的深度学习模型之一。在海洋生物保护、海洋环境监测等应用中，快速识别和检测海洋动物种类对于科学研究和保护工
我用DeepSeek写代码一周后，发现了这些惊人的秘密 fangwulongtian python 开发语言人工智能
大家好，我是武哥。作为一名有着10年开发经验的程序员，最近我深度体验了DeepSeek的代码能力，不得不说，这款国产大模型给了我太多惊喜。今天，我要和大家分享使用DeepSeek一周以来的心得体会，以及我发现的一些不为人知的"秘密武器"。1.惊人发现一：超强的代码理解能力1.1精准的代码解析先看一个实际案例：# 一个较为复杂的Python类class DataProcessor: def _
python利用matplotlib画图湘妞妞 matplotlib python 开发语言
一、折线图importmatplotlib.pyplotasplty1=[10,13,5,40,30,60,70,12,55,25]x1=range(0,10)x2=range(0,10)y2=[5,8,0,30,20,40,50,10,40,15]plt.plot(x1,y1,label='Fristline',linewidth=3,color='r',marker='o',markerfac
python学习环境 HelloWorld！ python使用 python
python学习环境python的安装Anaconda的安装Anaconda虚拟环境pythonIDE的选择pycharm项目的环境变量选择从这篇文章开始，记录python学习的过程。本篇从python学习的环境开始展开。python的安装我主要是在windows环境下进行python3的学习。我所了解到主要有两种常见的python安装方法。直接在python官方网站上下载python，然后进行安
python原生代码中的列表，元组和数组的区别,一个表格搞明白涛涛讲AI AI编程效率工具 python 开发语言
经常搞混，以备后用。在Python原生代码里，数组一般是指由array模块创建的数组，下面以表格形式呈现列表、元组和array模块数组的区别：在Python原生代码里，数组一般是指由array模块创建的数组，下面以表格形式呈现列表、元组和array模块数组的区别：对比维度列表（list）元组（tuple）数组（array.array）定义语法使用方括号[]定义，元素间用逗号分隔。示例：my_lis
实现python命令行 FLY@CYX python 服务器 linux
如何在python程序中自定义python命令行输入参数及相关提示呢？让我们来学习一下吧。1.首先明确用到的模块，要导入optparse和sys模块，前者用于解析参数，后者用于获取终端参数。2.其次编写readcommand函数，具体实现如代码所示，大致流程可理解为：编写提示词->添加可选参数项->解析参数,并取得参数->返回处理参数后得到的字典，便于后续调用。importsysdefdefaul
Python-Matplotlib可视化（2）——自定义颜色绘制精美统计图 2401_87373347 python matplotlib 开发语言
使用自定义颜色绘制曲线图使用自定义颜色绘制散点图为所有点使用相同的颜色为每个点定义不同的颜色为散点图中数据点的边使用自定义颜色使用自定义颜色绘制条形图使用自定义颜色绘制饼图使用自定义颜色绘制箱型图使用色彩映射绘制散点图使用色彩映射绘制条形图创建自定义配色方案系列链接前言matplotlib提供的所有绘图都带有默认样式。虽然这可以进行快速绘图，但有时可能需要自定义绘图的颜色和样式，以对绘制更加精美、
Python基于Django的漏洞扫描系统【附源码、文档说明】 Java老徐 Python 毕业设计 python django 漏洞扫描系统漏洞扫描 Python漏洞扫描系统 Python Django
博主介绍：✌Java老徐、7年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2024-2025年Java毕业设计选题推荐Python基于Django的微博热搜、微博舆论可视化系统（V3.0）基于PythonDjango的北极星招聘数据可视化系统感兴趣的可以先收
什么是python uv，如何在windows上安装uv，基础的用法有哪些？几道之旅 python uv windows
什么是PythonUV？UV是由Astral公司（Rust工具Ruff的开发者）推出的高性能Python包管理工具，基于Rust编写，旨在替代传统的pip和pip-tools。其核心优势在于极快的速度（比pip快10-100倍）、轻量级设计（仅几十MB）以及现代化的依赖管理（支持pyproject.toml和uv.lock文件）。UV集成了虚拟环境管理、Python版本控制、依赖解析等功能，目标是
【Python爬虫①】专栏开篇：夯实Python基础奔跑吧邓邓子 Python爬虫 python 爬虫开发语言基础知识
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、引言二、Python语法基础2.1变量2.2数据类型2.3运算
Blazor 组件库 BootstrapBlazor 中Editor组件介绍虚幻私塾 python 计算机
优质资源分享学习路线指引（点击解锁）知识定位人群定位Python实战微信订餐小程序进阶级本课程是pythonflask+微信小程序的完美结合，从项目搭建到腾讯云部署上线，打造一个全栈订餐系统。Python量化交易实战入门级手把手带你打造一个易扩展、更安全、效率更高的量化交易系统组件介绍Editor组件是对Summernote组件的二次封装。组件分为div模式和editor模式。默认状态下edito
Python学习笔记 - 探索正则表达式re元字符 Mr数据杨 Python 编程基础正则表达式 python 编程基础元字符
在Python编程中，正则表达式（RegularExpressions，简称re）是一种强大的工具，用于匹配字符串中的特定模式。无论是在数据清洗、文本解析，还是在日常脚本编写中，正则表达式都可以极高的效率完成复杂的字符串操作任务。然而，正则表达式的语法略显复杂，尤其是其中的元字符（Metacharacters），初学者在使用时往往感到困惑。本教程旨在通过详细的概念解释、操作指导以及实际应用示例，帮
python面试题 python
以下是一些Python面试题：一、基础语法Python中的列表（list）和元组（tuple）有什么区别？答案：可变性：列表是可变的，可以修改列表中的元素、添加或删除元素；元组是不可变的，一旦创建就不能修改。语法：列表使用方括号[]定义，元组使用圆括号()定义（单个元素的元组需要在元素后面加逗号，如(1,)）。性能：由于元组的不可变性，在某些情况下元组的性能比列表略高，例如在用作字典的键时（字典的
Python机器学习舆情分析项目案例分享数澜悠客数字化转型 python 机器学习开发语言
数据收集与准备1.数据收集多样化数据源：从社交媒体平台（如微博、Twitter）、新闻网站、论坛等多渠道收集数据，以获取更全面的舆情信息。可以使用Python的requests库和网页解析库（如BeautifulSoup）进行网页数据爬取，使用Tweepy库获取Twitter数据。数据标注：对于监督学习，需要对收集到的数据进行标注，标记为积极、消极或中性等类别。可以使用人工标注的方式，也可以利用半
开源ERP系统odoo的安装与配置 catmes 开源 ERP python postgresql OpenERP
开源ERP系统odoo的安装与配置安装下载源码安装PostgreSQL安装Python3下载odoo依赖配置启动安装安装方式有两种:分发包安装:https://www.odoo.com/documentation/16.0/administration/install/packages.html源码安装:https://www.odoo.com/documentation/16.0/adminis
2月第五讲：深度剖析 Python 编程中的数据处理与机器学习应用 2501_90442144 python 机器学习开发语言
一、引言在当今数字化时代，编程已经成为推动各个领域发展的关键力量。Python作为一种高级编程语言，以其简洁、易读、功能强大等特点，在数据处理、机器学习、人工智能等众多领域得到了广泛的应用。本文将深入探讨Python在数据处理和机器学习方面的应用，通过实际案例展示其强大的功能和灵活性，帮助读者更好地理解和掌握Python编程在这些领域的应用技巧。二、Python基础概述2.1Python的特点与优
|网络安全|网络安全学习方法网络安全King web安全学习方法安全
1、先网络后安全很多初学者还没搞定网络看懂网络拓扑，就急着研究防火墙或VPN，其实这样就不清楚整个网络架构是如何安全演进的。正确的流程是：先通过网络协议和拓扑设计的学习，能独立搭建一个企业网/校园网，再引入局域网安全、防火墙、入侵检测、VPN等安全技术，使整个网络慢慢变得安全起来，这样才能看到整个网络安全的全貌。2、勤做实验勤抓包目前各大网络和安全厂商都有对应的模拟器，不再需要硬件支持就可以在电脑
基于Python实现的缓存淘汰替换策略算法，该算法将缓存分区 go5463158465 算法 python python 缓存算法
以下是一个基于Python实现的缓存淘汰替换策略算法，该算法将缓存分区，并根据不同分区的优先级进行淘汰，同时会自适应地调整缓存汰换的时机和力度，还会与GPTCache自带的LRU和FIFO策略进行对比。importtimefromgptcache.managerimportCacheBase,VectorBase,get_data_managerfromgptcache.processor.pre
Python中的序列类型-列表 Merlyn10 Python python
在Python中的序列类型包括：列表（list）,元组（tuple）,字典（dict)和集合（set）。list和tuple较为相似，都按顺序保存元素，占用一块连续的内存，通过索引访问元素。不同之处在于list可以修改，而tuple不可以修改。dict和set存储的数据是无序的，每个元素占用不同的内存。列表（List）1.所有元素，放在一对中括号[]里，相邻元素“，”分隔；2.同一个列表可以包含不
【2023】LeetCode HOT 100——滑动窗口&子串「已注销」 leetcode 算法数据结构
目录1.无重复字符的最长子串1.1C++实现1.2Python实现1.3时空分析2.找到字符串中所有字母异位词2.1C++实现2.2Python实现2.3时空分析3.和为K的子数组3.1C++实现3.2Python实现3.3时空分析4.滑动窗口最大值4.1C++实现4.2Python实现4.3时空分析5.最小覆盖子串5.1C++实现5.2Python实现5.3时空分析1.无重复字符的最长子串原题链
python期权定价：欧式香草期权-二叉树 2401_88673555 期权定价 python 金融
1、函数实现：binomial_european_option_price函数基于二叉树模型计算欧式期权的价格，其中：二叉树构建：通过上涨因子u=e^(σ√Δt)和下跌因子d=1/u模拟标的资产价格路径。风险中性概率：p=(e^(rΔt)-d)/(u-d)，用于计算未来现金流的期望值。折现因子：df=e^(-rΔt)，将未来价值折现到当前。初始化到期价值：计算到期时所有可能价格路径的期权内在价值。
3.2.2 具体的案例展示uvm_object在实际验证中的应用？啄缘之间 UVM学习总结学习 sv uvm verilog 测试用例
文章目录前言一、案例一：使用uvm_object_utils()简化对象类设计1.1示例代码二、案例二：基于《UVM实战》的验证平台2.1示例代码三、案例三：以太网验证平台3.1示例代码四、案例四：验证一个简单的总线接口4.1、具体实现1.定义派生自`uvm_object`的事务类2.定义序列类3.定义驱动类4.定义环境类5.定义测试类6.顶层测试平台4.2、总结五、总结前言以下是几个具体的案例或
pythonweb项目实例-Python Web项目实战Day05 - 编写Web框架 weixin_39593427
在正式开始Web开发前，我们需要编写一个Web框架。aiohttp已经是一个Web框架了，为什么我们还需要自己封装一个？原因是从使用者的角度来说，aiohttp相对比较底层，编写一个URL的处理函数需要这么几步：第一步，编写一个用@asyncio.coroutine装饰的函数：@asyncio.coroutinedefhandle_url_xxx(request):pass第二步，传入的参数需要自
一个神奇的自动化爬虫利器 - DrissionPagae Art_s 自动化爬虫运维
DrissionPagaeDrissionPage：类似selenuium的网页自动化工具。这是一个基于Python的网页自动化工具，支持Chromium内核浏览器。它将控制浏览器和收发请求两大功能合二为一，并提供了统一、简洁的接口。环境操作系统：Windows、Linux或Mac。python版本：3.6及以上支持应用：Chromium内核浏览器（如Chrome、Edge），electron应用
【OpenCV】双目相机计算深度图和点云 AI大权计算机视觉 opencv 双目相机点云 python
双目相机计算深度图的基本原理是通过两台相机从不同角度拍摄同一场景，然后利用视差来计算物体的距离。本文的Python实现示例，使用OpenCV库来处理图像和计算深度图。1、数据集介绍Mobilestereodatasets由PanGuanghan、SunTiansheng、TobyWeed和DanielScharstein在2019-2021年期间创建的，使用了RogerDai、KyleMeredi
快速排序及其Python解法 2201_75292354 Python基础算法算法数据结构 python
1.题目给定一个长度为n的整数，使用快速排序对这个数列按照从小到大进行排序，并将排好顺序的数列按照顺序进行输出。1.1输入格式输入共两行，第一行包含整数n，第二行包含n个整数（所有整数均在1∼1091∼109范围内），表示整个数列。1.2输出格式输出共一行，包含nn个整数，表示排好序的数列。1.3数据范围1.4输入样例：5312451.5输出样例：123452.解题步骤2.1读取输入样例n=int
Python Web 开发案例解析伤我者亡课程讲解 python 前端开发语言
一、Flask基础应用案例（一）项目搭建与初始化环境准备安装Python解释器，确保版本符合Flask要求，如Python3.6及以上。使用pip安装Flask库，命令为pipinstallflask。可以创建虚拟环境，如python-mvenvvenv，激活虚拟环境后再进行项目开发，避免依赖冲突。项目结构规划创建项目根目录，如my_flask_project。在根目录下创建app.py作为Fla
Python网络通信：从基础到高级应用 IT策士 python 网络开发语言 linux
Python网络通信：从基础到高级应用1.引言在当今互联网时代，网络通信已经成为现代软件开发中不可或缺的一部分。Python作为一种versatile编程语言，提供了丰富的网络编程库和工具，使得开发者能够轻松地构建各种网络应用。本文将深入探讨Python网络通信的方方面面，从基础的套接字编程到高级的异步网络框架，帮助您全面掌握Python网络编程技能。2.网络基础知识在深入Python网络编程之前
Java常用排序算法/程序员必须掌握的8大排序算法 cugfy java
分类： 1）插入排序（直接插入排序、希尔排序） 2）交换排序（冒泡排序、快速排序） 3）选择排序（直接选择排序、堆排序） 4）归并排序 5）分配排序（基数排序）所需辅助空间最多：归并排序所需辅助空间最少：堆排序平均速度最快：快速排序不稳定：快速排序，希尔排序，堆排序。先来看看8种排序之间的关系： 1.直接插入排序（1
【Spark102】Spark存储模块BlockManager剖析 bit1129 manager
Spark围绕着BlockManager构建了存储模块，包括RDD，Shuffle，Broadcast的存储都使用了BlockManager。而BlockManager在实现上是一个针对每个应用的Master/Executor结构，即Driver上BlockManager充当了Master角色，而各个Slave上(具体到应用范围，就是Executor)的BlockManager充当了Slave角色
linux 查看端口被占用情况详解 daizj linux 端口占用 netstat lsof
经常在启动一个程序会碰到端口被占用，这里讲一下怎么查看端口是否被占用，及哪个程序占用，怎么Kill掉已占用端口的程序 1、lsof -i:port port为端口号 [root@slave /data/spark-1.4.0-bin-cdh4]# lsof -i:8080 COMMAND PID USER FD TY
Hosts文件使用周凡杨 hosts locahost
一切都要从localhost说起，经常在tomcat容器起动后，访问页面时输入http://localhost:8088/index.jsp，大家都知道localhost代表本机地址，如果本机IP是10.10.134.21，那就相当于http://10.10.134.21:8088/index.jsp，有时候也会看到http: 127.0.0.1:
java excel工具 g21121 Java excel
直接上代码，一看就懂，利用的是jxl： import java.io.File; import java.io.IOException; import jxl.Cell; import jxl.Sheet; import jxl.Workbook; import jxl.read.biff.BiffException; import jxl.write.Label; import
web报表工具finereport常用函数的用法总结（数组函数）老A不折腾 finereport web报表函数总结
ADD2ARRAY ADDARRAY(array,insertArray, start):在数组第start个位置插入insertArray中的所有元素，再返回该数组。示例： ADDARRAY([3,4, 1, 5, 7], [23, 43, 22], 3)返回[3, 4, 23, 43, 22, 1, 5, 7]. ADDARRAY([3,4, 1, 5, 7], "测试&q
游戏服务器网络带宽负载计算墙头上一根草服务器
家庭所安装的4M，8M宽带。其中M是指，Mbits/S 其中要提前说明的是： 8bits = 1Byte 即8位等于1字节。我们硬盘大小50G。意思是50*1024M字节，约为 50000多字节。但是网宽是以“位”为单位的，所以，8Mbits就是1M字节。是容积体积的单位。 8Mbits/s后面的S是秒。8Mbits/s意思是每秒8M位，即每秒1M字节。我是在计算我们网络流量时想到的
我的spring学习笔记2-IoC（反向控制依赖注入） aijuans Spring 3 系列
IoC（反向控制依赖注入）这是Spring提出来了，这也是Spring一大特色。这里我不用多说，我们看Spring教程就可以了解。当然我们不用Spring也可以用IoC，下面我将介绍不用Spring的IoC。 IoC不是框架，她是java的技术，如今大多数轻量级的容器都会用到IoC技术。这里我就用一个例子来说明：如：程序中有 Mysql.calss 、Oracle.class 、SqlSe
高性能mysql 之选择存储引擎(一) annan211 mysql InnoDB MySQL引擎存储引擎
1 没有特殊情况，应尽可能使用InnoDB存储引擎。原因：InnoDB 和 MYIsAM 是mysql 最常用、使用最普遍的存储引擎。其中InnoDB是最重要、最广泛的存储引擎。她被设计用来处理大量的短期事务。短期事务大部分情况下是正常提交的，很少有回滚的情况。InnoDB的性能和自动崩溃恢复特性使得她在非事务型存储的需求中也非常流行，除非有非常
UDP网络编程百合不是茶 UDP编程局域网组播
UDP是基于无连接的,不可靠的传输与TCP/IP相反 UDP实现私聊,发送方式客户端,接受方式服务器 package netUDP_sc; import java.net.DatagramPacket; import java.net.DatagramSocket; import java.net.Ine
JQuery对象的val()方法执行结果分析 bijian1013 JavaScript js jquery
JavaScript中，如果id对应的标签不存在（同理JAVA中，如果对象不存在），则调用它的方法会报错或抛异常。在实际开发中，发现JQuery在id对应的标签不存在时，调其val()方法不会报错，结果是undefined。
http请求测试实例（采用json-lib解析） bijian1013 json http
由于fastjson只支持JDK1.5版本，因些对于JDK1.4的项目，可以采用json-lib来解析JSON数据。如下是http请求的另外一种写法，仅供参考。 package com; import java.util.HashMap; import java.util.Map; import
【RPC框架Hessian四】Hessian与Spring集成 bit1129 hessian
在【RPC框架Hessian二】Hessian 对象序列化和反序列化一文中介绍了基于Hessian的RPC服务的实现步骤，在那里使用Hessian提供的API完成基于Hessian的RPC服务开发和客户端调用，本文使用Spring对Hessian的集成来实现Hessian的RPC调用。定义模型、接口和服务器端代码 |---Model &nb
【Mahout三】基于Mahout CBayes算法的20newsgroup流程分析 bit1129 Mahout
1.Mahout环境搭建 1.下载Mahout http://mirror.bit.edu.cn/apache/mahout/0.10.0/mahout-distribution-0.10.0.tar.gz 2.解压Mahout 3. 配置环境变量 vim /etc/profile export HADOOP_HOME=/home
nginx负载tomcat遇非80时的转发问题 ronin47
　　nginx负载后端容器是tomcat（其它容器如WAS,JBOSS暂没发现这个问题）非８０端口，遇到跳转异常问题。解决的思路是：$host:port 详细如下：　　该问题是最先发现的，由于之前对nginx不是特别的熟悉所以该问题是个入门级别的： ? 1 2 3 4 5
java-17-在一个字符串中找到第一个只出现一次的字符 bylijinnan java
public class FirstShowOnlyOnceElement { /**Q17.在一个字符串中找到第一个只出现一次的字符。如输入abaccdeff，则输出b * 1.int[] count:count[i]表示i对应字符出现的次数 * 2.将26个英文字母映射：a-z <--> 0-25 * 3.假设全部字母都是小写 */ pu
mongoDB 复制集开窍的石头 mongodb
mongo的复制集就像mysql的主从数据库，当你往其中的主复制集(primary)写数据的时候，副复制集(secondary)会自动同步主复制集(Primary)的数据,当主复制集挂掉以后其中的一个副复制集会自动成为主复制集。提供服务器的可用性。和防止当机问题 mo
[宇宙与天文]宇宙时代的经济学 comsci 经济
宇宙尺度的交通工具一般都体型巨大，造价高昂。。。。。在宇宙中进行航行，近程采用反作用力类型的发动机，需要消耗少量矿石燃料，中远程航行要采用量子或者聚变反应堆发动机，进行超空间跳跃，要消耗大量高纯度水晶体能源以目前地球上国家的经济发展水平来讲，
Git忽略文件 Cwind git
有很多文件不必使用git管理。例如Eclipse或其他IDE生成的项目文件，编译生成的各种目标或临时文件等。使用git status时，会在Untracked files里面看到这些文件列表，在一次需要添加的文件比较多时（使用git add . / git add -u），会把这些所有的未跟踪文件添加进索引。 ==== ==== ==== 一些牢骚
MySQL连接数据库的必须配置 dashuaifu mysql 连接数据库配置
MySQL连接数据库的必须配置 1.driverClass：com.mysql.jdbc.Driver 2.jdbcUrl：jdbc:mysql://localhost:3306/dbname 3.user：username 4.password：password 其中1是驱动名；2是url，这里的‘dbna
一生要养成的60个习惯 dcj3sjt126com 习惯
一生要养成的60个习惯第1篇让你更受大家欢迎的习惯 1 守时，不准时赴约,让别人等,会失去很多机会。如何做到： ①该起床时就起床， ②养成任何事情都提前15分钟的习惯。 ③带本可以随时阅读的书，如果早了就拿出来读读。 ④有条理，生活没条理最容易耽误时间。 ⑤提前计划：将重要和不重要的事情岔开。 ⑥今天就准备好明天要穿的衣服。 ⑦按时睡觉，这会让按时起床更容易。 2 注重
[介绍]Yii 是什么 dcj3sjt126com PHP yii2
Yii 是一个高性能，基于组件的 PHP 框架，用于快速开发现代 Web 应用程序。名字 Yii （读作易）在中文里有“极致简单与不断演变”两重含义，也可看作 Yes It Is! 的缩写。 Yii 最适合做什么？ Yii 是一个通用的 Web 编程框架，即可以用于开发各种用 PHP 构建的 Web 应用。因为基于组件的框架结构和设计精巧的缓存支持，它特别适合开发大型应
Linux SSH常用总结 eksliang linux ssh SSHD
转载请出自出处：http://eksliang.iteye.com/blog/2186931 一、连接到远程主机格式： ssh name@remoteserver 例如： ssh ickes@192.168.27.211 二、连接到远程主机指定的端口格式： ssh name@remoteserver -p 22 例如： ssh i
快速上传头像到服务端工具类FaceUtil gundumw100 android
快速迭代用 import java.io.DataOutputStream; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.FileOutputStream; import java.io.IOExceptio
jQuery入门之怎么使用 ini JavaScript html jquery Web css
jQuery的强大我何问起（个人主页：hovertree.com）就不用多说了，那么怎么使用jQuery呢？首先，下载jquery。下载地址：http://hovertree.com/hvtart/bjae/b8627323101a4994.htm，一个是压缩版本，一个是未压缩版本，如果在开发测试阶段，可以使用未压缩版本，实际应用一般使用压缩版本(min)。然后就在页面上引用。
带filter的hbase查询优化 kane_xie 查询优化 hbase RandomRowFilter
问题描述 hbase scan数据缓慢，server端出现LeaseException。hbase写入缓慢。问题原因直接原因是： hbase client端每次和regionserver交互的时候，都会在服务器端生成一个Lease,Lease的有效期由参数hbase.regionserver.lease.period确定。如果hbase scan需
java设计模式-单例模式 men4661273 java 单例枚举反射 IOC
单例模式1，饿汉模式 //饿汉式单例类.在类初始化时，已经自行实例化 public class Singleton1 { //私有的默认构造函数 private Singleton1() {} //已经自行实例化 private static final Singleton1 singl
mongodb 查询某一天所有信息的3种方法，根据日期查询 qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
// mongodb的查询真让人难以琢磨，就查询单天信息，都需要花费一番功夫才行。 // 第一种方式： coll.aggregate([ {$project:{sendDate: {$substr: ['$sendTime', 0, 10]}, sendTime: 1, content:1}}, {$match:{sendDate: '2015-
二维数组转换成JSON tangqi609567707 java 二维数组 json
原文出处：http://blog.csdn.net/springsen/article/details/7833596 public class Demo { public static void main(String[] args) { String[][] blogL
erlang supervisor wudixiaotie erlang
定义supervisor时，如果是监控celuesimple_one_for_one则删除children的时候就用supervisor:terminate_child (SupModuleName, ChildPid)，如果shutdown策略选择的是brutal_kill，那么supervisor会调用exit(ChildPid, kill)，这样的话如果Child的behavior是gen_

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他