guangcheng0312q

Scrapy框架之爬取城市天气预报

Scrapy框架之爬取城市天气预报_第1张图片

Scrapy框架之爬取城市天气预报

【今日知图】

vi 定位

vi l.py +5 直接进入错误代码第5行
vi l.py + 直接定位最后一行

1.项目初始化2.提取数据 2.1 原理分析 2.2 数据抽取 2.3 自定义spider3.存储数据 3.1 修改settings.py 3.2 数据存储4.结果展示5.作者的话

1.项目初始化

创建项目

scrapy startproject weather

创建Spider

scrapy genspider CqtianqiSpider tianqi.com
'''
由于CqtianqiSpider这个名字在后面scrapy crawl CqtianqiSpider中,
CqtianqiSpider名字太长,将spider中的name改为CQtianqi,
然后命令变为：scrapy crawl CQtianqi
'''

2.提取数据

2.1 原理分析

Scrapy框架之爬取城市天气预报_第2张图片

这次目的是抽取重庆及盐湖区7日天气预报,具体源码情况如上图所示，截出的就是本次爬虫所需要定位的地方。

接下来，定义以下存储的数据!

date = 当日日期
week = 星期几
img = 当日天气图标
wind = 当日风况
weather = 当日天气
high_temperature = 当日最高温度
low_temperature = 当日最低温度

2.2 数据抽取

修改items.py

import scrapy
class WeatherItem(scrapy.Item):
    # define the fields for your item here like:
    # name = scrapy.Field()
    collection = 'weather'
    date = scrapy.Field()
    week = scrapy.Field()
    img = scrapy.Field()
    high_temperature = scrapy.Field()
    low_temperature = scrapy.Field()
    weather = scrapy.Field()
    wind = scrapy.Field()

2.3 自定义spider

CQtianqi.py

# -*- coding: utf-8 -*-
import scrapy
from weather.items import WeatherItem
class CqtianqiSpider(scrapy.Spider):
    name = 'CQtianqi'
    allowed_domains = ['tianqi.com']
    start_urls = []
    citys = ['chongqing','yanhuqu']
    for city in citys:
        start_urls.append('http://'  + 'www.tianqi.com/' + city + '/')
    def parse(self, response):
        '''
        date = 当日日期
        week = 星期几
        img = 当日天气图标
        wind = 当日风况
        weather = 当日天气
        high_temperature = 当日最高温度
        low_temperature = 当日最低温度
        :param response:
        :return:
        '''
        # oneweek = response.xpath('//div[@class="day7"]')
        item = WeatherItem()
        date = response.xpath('//div[@class="day7"]//ul[@class="week"]//li//b/text()').extract()
        week = response.xpath('//div[@class="day7"]//ul[@class="week"]//li//span/text()').extract()
        base_url = 'http:'
        img = response.xpath('//div[@class="day7"]//ul[@class="week"]//li//img/@src').extract()
        imgs = []
        for i in range(7):
            img_i = img[i]
            img_url = base_url + img_i
            imgs.append(img_url)

        print(date)
        print(week)
        print(imgs)
        weather = response.xpath('//div[@class="day7"]//ul[@class="txt txt2"]//li/text()').extract()

        print(weather)
        high_temperature = response.xpath('//div[@class="day7"]//div[@class="zxt_shuju"]/ul//li/span/text()').extract()
        low_temperature = response.xpath('//div[@class="day7"]//div[@class="zxt_shuju"]/ul//li/b/text()').extract()
        print(high_temperature)
        print(low_temperature)

        wind = response.xpath('//div[@class="day7"]//ul[@class="txt"][1]//li/text()').extract()
        print(wind)

        item['date'] = date
        item['week'] = week
        item['img'] = imgs
        item['weather'] = weather
        item['wind'] = wind
        item['high_temperature'] = high_temperature
        item['low_temperature'] = low_temperature
        yield item

3.存储数据

3.1 修改settings.py

# 这两行直接添加
MONGO_URI = 'localhost'
MONGO_DB = 'test'
# 以下直接修改
ITEM_PIPELINES = {
   'weather.pipelines.WeatherPipeline': 300,
   'weather.pipelines.W2json': 301,
   'weather.pipelines.MongoPipeline': 302,
   'weather.pipelines.W2mysql': 303,
}
ROBOTSTXT_OBEY = False
USER_AGENT = 'Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Mobile Safari/537.36'

3.2 数据存储

修改pipelines.py

存储MongoDB

class MongoPipeline(object):
    def __init__(self, mongo_uri, mongo_db):
        self.mongo_uri = mongo_uri
        self.mongo_db = mongo_db

    @classmethod
    def from_crawler(cls, crawler):
        return cls(
            mongo_uri=crawler.settings.get('MONGO_URI'),
            mongo_db=crawler.settings.get('MONGO_DB')
        )

    def open_spider(self, spider):
        self.client = pymongo.MongoClient(self.mongo_uri)
        self.db = self.client[self.mongo_db]

    def process_item(self, item, spider):

        self.db[item.collection].insert(dict(item))
        return item

    def close_spider(self, spider):
        self.client.close()

存储Mysql

    def process_item(self, item, spider):
        '''
        将爬取的信息保存到mysql
        '''

        connection = pymysql.connect(host='localhost', user='root', password='xxx', db='scrapydb',
                                     charset='utf8mb4')
        try:

            with connection.cursor() as cursor:
                for i in range(7):
                    sql = "insert into `weather`(`date`,`week`,`high_temperature`,`low_temperature`,`weather`,`wind`,`img`)values(%s,%s,%s,%s,%s,%s,%s)"
                    cursor.execute(sql, (
                        item['date'][i], item['week'][i], item['high_temperature'][i], item['low_temperature'][i],
                        item['weather'][i],
                        item['wind'][i], item['img'][i]))

                connection.commit()
        # except pymysql.err.IntegrityError as e:
        #     print('重复数据，勿再次插入!')
        finally:
            connection.close()
        return item

存储至txt

class WeatherPipeline(object):
    def process_item(self, item, spider):
        # 文件存在data目录下的weather.txt文件内
        fiename = pathdir + '\\data\\weather.txt'
        # 从内存以追加的方式打开文件，并写入对应的数据
        with open(fiename, 'a', encoding='utf8') as f:
            for i in range(7):
                f.write('日期:' + item['date'][i] + '\n')
                f.write('星期:' + item['week'][i] + '\n')
                f.write('最高温度:' + item['high_temperature'][i] + '\n')
                f.write('最低温度' + item['low_temperature'][i] + '\n')
                f.write('天气:' + item['weather'][i] + '\n')
                f.write('风况:' + item['wind'][i] + '\n')
                f.write('-------------------------------------' + '\n')

        return item

存储至json

class W2json(object):
    def process_item(self, item, spider):
        '''
        讲爬取的信息保存到json
        方便调用
        '''
        filename = pathdir + '\\data\\weather.json'

        # 打开json文件，向里面以dumps的方式吸入数据
        # 注意需要有一个参数ensure_ascii=False ，不然数据会直接为utf编码的方式存入比如:“/xe15”
        with open(filename, 'a', encoding='utf8') as f:
            line = json.dumps(dict(item), ensure_ascii=False) + '\n'
            f.write(line)

        return item

运行

进入到weather根目录而不是weather下面的weather里面哦！！！

scrapy crawl CQtianq

4.结果展示

数据存储至txt

这里只截了一部分数据，实际每个重复两次。

Scrapy框架之爬取城市天气预报_第3张图片

数据存储至json

这个不是重复，存储的是两个地区数据！

数据存储至MongoDB

这个不是重复，存储的是两个地区数据！

Scrapy框架之爬取城市天气预报_第4张图片

数据存储至MySql

这个不是重复，存储的是两个地区数据！

Scrapy框架之爬取城市天气预报_第5张图片

终端运行

Scrapy框架之爬取城市天气预报_第6张图片

5.作者的话

最后，您如果觉得本公众号对您有帮助，欢迎您多多支持，转发，谢谢！更多内容，请关注本公众号爬虫系列！点击阅读原文，查看源代码，不要忘记star哈~~

我今天才知道，我之所以漂泊就是在向你靠近。

--《廊桥遗梦》

你可能感兴趣的:(Scrapy框架之爬取城市天气预报)

掌握 Python 网络爬虫技术：从基础入门到高级实践（附带爬虫案例）一ge科研小菜鸡 Python 编程语言 python
个人主页：一ge科研小菜鸡-CSDN博客期待您的关注网络爬虫是自动访问网站并抓取网页数据的程序。Python凭借其丰富的库和易于使用的特性，成为开发网络爬虫的首选语言。本文将详细介绍如何使用Python进行网络爬虫开发，包括基本概念、主要工具、数据解析和高级爬取技术，并提供一个完整的实践案例。1.网络爬虫概述1.1什么是网络爬虫？网络爬虫（WebCrawler）是指用于访问和抓取网页内容的自动化脚
使用Python爬虫抓取与分析航班信息：从数据采集到应用的完整实践 Python爬虫项目 2025年爬虫实战项目 python selenium 自动化爬虫开发语言 php microsoft
目录：前言爬虫基础知识什么是爬虫？爬虫的工作原理爬虫的应用领域航班数据爬取的实际应用航班数据分析的重要性选择爬虫技术栈常见的爬虫框架与工具选择合适的工具：requestsvsSeleniumvsScrapy如何获取航班信息航班数据来源分析航班信息的结构与抓取目标爬虫抓取航班信息的步骤发送HTTP请求并获取航班数据使用Selenium抓取动态数据解析HTML页面并提取航班信息航班数据存储与处理存储抓
企业级包管理器之 monorepo&multirepo (8) 王解企业级包管理器 monorepo multirepo
在企业级项目开发中，面对多个项目的管理，monorepo和multirepo是两种常见的代码管理方案，它们各有特点与优劣，下面我们来详细了解一下。一、基本概念monorepo：“mono”在英语中有“单一的、单独的”之意，“repo”是“repository”（仓库）的简写，所以monorepo指的就是使用单一仓库来管理多个项目。那什么算是一个仓库呢？一般来讲，一个仓库是指通过版本控制系统（git
＜sa8650＞sa8650 qcxserver-之-摄像头传感器VB56G4A驱动开发＜1＞ waterAdmin 驱动开发 linux xml 车载系统视觉检测汽车
＜sa8650＞sa8650qcxserver-之-摄像头传感器VB56G4A驱动开发一、前言二、QCX架构三、QCX传感器驱动程序定制开发3.1sensor硬件接口3.2sensor配置文件3.2.1cameraconfig.c3.2.2cameraconfigsa8650_water.c3.2.3新增编译MK3.2.4参数解析3.2.4.1structCameraConfigI2CDevice
＜sa8650＞sa8650 qcxser-之-sensor中断分析 waterAdmin 车载系统视觉检测视频编解码 c++c语言
＜sa8650＞sa8650qcxser-之-sensor中断分析1前言2cameraConfig参数2.1定义cameraConfig参数2.2GPIO选择2.2平台获取cameraConfig参数3sensor(解串器)中断初始化3.1sensor(解串器)中断配置3.2平台中sensor(解串器)中断配置3.2.1pCtxt->platform_fcn_tbl.SetupGpioInterr
ESP32 之 ESP-IDF 教学（十二）WiFi篇—— LwIP 之 TCP 通信 Augtons正(单片机) ESP32 教学专栏 (基于ESP-IDF)udp tcp/ip 单片机物联网 c语言
本文章来自原创专栏《ESP32教学专栏(基于ESP-IDF)》，讲解如何使用ESP-IDF构建ESP32程序，发布文章并会持续为已发布文章添加新内容！每篇文章都经过了精打细磨！↓↓↓通过下方对话框进入专栏目录页↓↓↓CSDN请求进入目录_Ox是否进入ESP32教学导航(基于ESP-IDF)?确定文章目录一、建立连接——ESP32作TCPClient客户端1.TCPClient的基本思路2.TCPC
智能工厂的设计软件应用场景的一个例子：为AI聊天工具添加一个知识系统之12 方案再探之3：特定于领域的模板之2 首次尝试和遗留问题解决一水鉴天软件智能智能制造人工语言人工智能
本文提要现在就剩下“体”本身的约定了--这必然是自律自省的，或者称为“戒律”--即“体”的自我训导discipline。完整表述为：严格双相的庄严“相”(侧），完全双性的本质“性”（侧）和双侧side双面face的外观“体”（自身）。通过Class(),Type()和Method()的声明来确保结构化最终能形式化（终结符号），以及形式化最初能结构化（初始断言）。在文档中相关的描述：两种描述文件下面
BlueZone：实现六边形架构的停车支付应用樊思露Roger
BlueZone：实现六边形架构的停车支付应用bluezoneAnexampleapplicationimplementingHexagonalArchitecture项目地址:https://gitcode.com/gh_mirrors/blu/bluezone项目介绍BlueZone是一个基于六边形架构（HexagonalArchitecture）的示例应用，旨在为城市中的汽车驾驶员提供远程停
【如何获取股票数据05】Python、Java等多种主流语言实例演示获取股票行情api接口之沪深A股最新分时MA数据获取实例演示及接口API说明文档码农蝶澈 python java 开发语言股票数据API 股票数据接口
最近一两年内，股票量化分析逐渐成为热门话题。而从事这一领域工作的第一步，就是获取全面且准确的股票数据。因为无论是实时交易数据、历史交易记录、财务数据还是基本面信息，这些数据都是我们进行量化分析时不可或缺的宝贵资源。我们的主要任务是从这些数据中提炼出有价值的信息，为我们的投资策略提供有力的指导。在数据探索的旅途中，我尝试了多种方法，包括自编网易股票页面爬虫、申万行业数据爬虫，以及同花顺问财的爬虫，甚
VUE之参数传递三日沐水 vue vue.js 前端 javascript
1、嵌套路由路由嵌套children里面的path属性不加/杠，可以参考如下代码：>>router/index.ts//创建一个路由器，并暴露出去//第一步：引入createRouterimport{createRouter,createWebHistory,createWebHashHistory}from'vue-router'//引入一个个可能呈现组件importHomefrom'@/pag
VUE之生命周期三日沐水 vue vue.js 前端 javascript
目录1、VUE2的生命周期1.1、创建（创建前，创建完毕）1.2、挂载（挂载前，挂载完毕）1.3、更新（更新前，更新完毕）1.4、销毁（销毁前，销毁完毕）2、VUE3的生命周期2.1、创建（setup）2.2、挂载（onBeforeMount、onMounted）2.3、更新（onBeforeUpdate、onUpdated）2.4、卸载（onBeforeUnmount、OnUnmounted）3
移动光猫之桥接教程猫耳朵朵 router
背景：移动宽带默认是移动光猫拨号，使用的路由模式，但移动的猫太差劲，需要将移动光猫改为桥接模式，改用红米AC2100路由器进行拨号上网。说干就干，开工。1、获取光猫超级用户和密码。用户名：CMCCAdmin超级密码：aDm8H%MdA2、登录光猫，进入设置界面。3、删除原有路由模式的拨号连接，截图保存原有设置参数，一定要删除。然后新建一个internet连接。4、新建的Internet连接参数，设
【如何获取股票数据01】Python、Java等多种主流语言实例演示获取股票行情api接口之沪深A股实时交易数据获取实例演示及接口API说明文档 Eumenides_max python java 开发语言
最近一两年内，股票量化分析逐渐成为热门话题。而从事这一领域工作的第一步，就是获取全面且准确的股票数据。因为无论是实时交易数据、历史交易记录、财务数据还是基本面信息，这些数据都是我们进行量化分析时不可或缺的宝贵资源。我们的主要任务是从这些数据中提炼出有价值的信息，为我们的投资策略提供有力的指导。在数据探索的旅途中，我尝试了多种方法，包括自编网易股票页面爬虫、申万行业数据爬虫，以及同花顺问财的爬虫，甚
机器学习入门——机器学习基本概念四月是你的机器学习
@机器学习什么是机器学习机器学习(MachineLearning,ML)是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心，是使计算机具有智能的根本途径，其应用遍及人工智能的各个领域，它主要使用归纳、综合而不是演绎简单来说机器学习就是机
Vue进阶之Vue无代码可视化项目（六） VillanelleS TypeScript Vue3基础前端 vue.js 前端 javascript
Vue无代码可视化项目渲染引擎（渲染器）初版TextBlock.vueChartBlock.vueImageBlock.vueLayoutView.vue渲染器BlockRenderer.vueLayoutView.vue进一步typestypes/block.tsmock/blocks.tsstores/editor.tsblocks/BlockRenderer.vueviews/LayoutV
为什么雷达系统难以探测到无人机？牧羊君雷达学习笔记无人机无人机探测
大家知道雷达系统很难识别出小型无人机和紧贴地面飞行的无人机。那么，对无人机探测的难点在哪呢？1.小型化和隐蔽性：许多无人机的体积小，那么雷达散射面积也小并且无人机在低空飞行，进一步降低了被雷达探测到的可能性。为了探测到目标，雷达须与无人机保持在视线范围。这在城市环境中尤其成问题，因为无人机可能在传感器视线内只出现几秒钟，然后再次消失。2.机动和悬停：无人机能够进行快速的机动飞行，而且可能随时改变飞
python学习系列之logging(一、基础教程) Idea King python3
文章目录1.什么是日志？为什么需要日志？2.什么时候使用什么级别的日志？2.1日志的级别3.logging基础教程3.1输出到控制台3.2记录日志到文件3.3从多个模块记录日志3.4记录变量数据3.5修改日志输出的格式参考文献按照官方使用说明进行编写1.什么是日志？为什么需要日志？日志是对软件执行时所发生事件的一种追踪方式。软件开发人员对他们的代码添加日志调用，借此来指示某事件的发生。一个事件通过
javascript中toFixed()四舍五入计算bug，及解决方法，四舍六入，五看奇偶并不精准，重新toFixed方法才是万全之策呀叫我小月儿字符串 js bug javascript
问题描述：最近做一个项目涉及金额计算保留两位小数，以前一直以为toFixed方法就是四舍五入的，上线后用户用户反馈计算出来的金额少了一分钱，跟其票面金额不一致，深入研究后发现使用toFixed保留两位小数是大坑呀。请看下面的例子：3.135.toFixed(2)**本以为是3.14，然而却是3.13！！！**网上有人整理出toFixed方法“四舍六入，五看奇偶”的原则：当舍去位的数值=6时，在舍去
python模块之psutil详解_基于python调用psutil模块过程解析谢艺馨
这篇文章主要介绍了基于python调用psutils模块过程解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下用Python来编写脚本简化日常的运维工作是Python的一个重要用途。在Linux下，有许多系统命令可以让我们时刻监控系统运行的状态，如ps，top，free等等。要获取这些系统信息，Python可以通过subprocess模块调用并获
「File」文本格式之 PugiXML对XML格式解析何曾参静谧「Lib」第三方库详解 xml
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「定制」定制开发集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」BlockUI集合「Py」Python程序设计「Math」探秘数学世界「PK」Paras
「C/C++」C++经验篇之常见的错误处理策略何曾参静谧 c语言 c++开发语言
✨博客主页何曾参静谧的博客（✅关注、点赞、⭐收藏、转发）全部专栏（专栏会有变化，以最新发布为准）「Win」Windows程序设计「IDE」集成开发环境「定制」定制开发集合「C/C++」C/C++程序设计「DSA」数据结构与算法「UG/NX」NX二次开发「QT」QT5程序设计「File」数据文件格式「UG/NX」BlockUI集合「Py」Python程序设计「Math」探秘数学世界「PK」Paras
python之subprocess模块 halazi100 #07python
从python2.4版本开始,可以用subprocess这个模块来产生子进程,并连接到子进程的标准输入/输出/错误中去，还可以得到子进程的返回值。subprocess意在替代其他几个老的模块或者函数，比如：os.systemos.spawn*os.popen*popen2.*commands.*一、subprocess.Popensubprocess模块定义了一个类：subprocess.Pope
项目测试之Postman LXMXHJ 后端开发知识储备 postman 测试工具
文章目录基础实战进行批量测试并输出报告基础实战进行批量测试并输出报告参考：https://blog.csdn.net/tyh_keephunger/article/details/109205191概述Newman是什么？Newman是Postman的命令行工具，用于执行接口测试集合。操作过程找到node目录以及所属版本情况node-v//node版本号nodewhere//查看node在哪里下载
菜鸟BUG之常见异常（二）苏白辛菜鸟BUG bug java 算法开发语言
继天地之灵气，借前辈之功，开道友之路伴，共勉目录六、类找不到或无法加载1、概述2、产生及解决1）ClassNotFoundException2）NoClassDefFoundError3、类找不到或无法加载主类1）概述2）分析解决3）归纳七、死锁1、什么是死锁2、产生条件1）互斥条件2）占有且等待3）不可强行占有4）循环等待条件3、预防死锁4、解决方法1）死锁预防2）死锁避免3）死锁检测和解除5、
为AI聊天工具添加一个知识系统之73 详细设计之14 正则表达式之1 一水鉴天智能制造人工语言软件智能网络人工智能
本文要点要点今天讨论“当代符号学的正则表达式：StringProcessor”。StringProcessor被视为当代符号学的正则表达式，表达的是思维的纯粹形式（逻辑表示无关，语言表达无关，程序实现无关）。StringProcessor自带投影规则-关注空性中心（符号学立场），它内嵌转换规则-隐藏共性内核（建筑术视角）和外挂映射规则-悬置个性外壳（诠释学观点）。正则表达式的三方智能合约：字母转换
为AI聊天工具添加一个知识系统之72 详细设计之13 图灵机一水鉴天软件智能人工语言智能制造人工智能
本文要点要点实际上是要设计一个图灵机，利用λ转换规则和λ演算来定义StringProcessor的发生产规则的转换功能。三种文法型运行图灵机来处理不同的串---符号串，数字串和文字串一个StrIngProcessor，图灵机（利用λ转换规则和λ演算来定义StringProcessor的发生产规则的转换功能），三种串(字符/数字/文字)，三种语法公式（term/atom/formula），三种文法型
智能工厂的设计软件应用场景的一个例子：为AI聊天工具添加一个知识系统之19 再次重建之4 职业能力程度(成熟度&进化度：集成&演进)评价 CSR 祖传代码：AI操作系统之2 一水鉴天人工语言智能制造软件智能人工智能
本文问题通过纲/目两者并举使能二者并进的偏序序积-斜成线（有秩-纲举目张），左边的行矢--横成行（有序-科目），顶上的列簇--竖成列（有线性-纲领）：语法类型Type（智能化&公理化=自动化，有序&线性=简单链chains），语用单调概念格规范图（有序列表lists智能化），语义一阶理论格规则公式（线性树trees公理化）。整个构成一种非常特别的矩阵（有秩有序有线的一个稠密矩阵）。GPT理解上有点
智能工厂的设计软件应用场景的一个例子：为AI聊天工具添加一个知识系统之7 附件（项目文档）一水鉴天人工语言智能制造软件智能人工智能
为AI聊天工具添加一个知识系统Part1人性化&去中心化前情提要这一次我们暂时抛开前面对“智能工厂的软件设计”的考虑--其软件智能产品就是应用程序。直接将这些思维方式和方法论运用在其具体应用场景中。本文是其中的一个应用场景。今天用了一个新的AI助手工具来交流。下面是就这一应用场景和“天意ChatGPT”（自称是ChatGPT4.0的直通通道）的Q&A。在现在各种AI聊天工具层出不穷的今天，我觉得特
智能工厂的设计软件应用场景的一个例子：为AI聊天工具添加一个知识系统之8 重新开始之1 特定于领域的模板--一个三套接的hoc结构一水鉴天软件智能人工语言智能制造人工智能状态模式
由于前面的项目信息全部丢失，所以重新建立了这个项目，并以前一篇文章（之7）中的内容作为项目附件重新沟通。本文要点特定于领域的模板--一个三套接的hoc结构。这是今天讨论的内容。它是本项目actors剧本原型。其地位：祖传代码脚本模板中的--一个div标签的内容模型，在三端架构中描述前端执行公式的“体”性。目的是准备完善出该项目。希望的做法是：我将我给出的附件文档中零散的一些考虑组成出完整的描述文字
智能工厂的设计软件应用场景的一个例子：为AI聊天工具添加一个知识系统之4 两种描述文件：source的自述文件和resource的描述文件一水鉴天人工智能
本文要点前面是为“描述”格式中描述项的未尽描述所所的扩展思考。现在我们回到前面的讨论。前面分析了我拿出来做例句的一段话中的三行文字（“自述”）--也基本上是文档“为AI聊天工具添加一个知识系统”的“枢纽”。进一步讨论这样的“枢纽”要怎样才能具备这个资格？那么，我们是否能基于这些讨论进一步准确根据三种处理器的描述文字确定三者在系统中的地位或作用呢？---就像刚刚我们确定了”语言处理器“或”网络“组件
Spring中@Value注解，需要注意的地方无量 spring bean @Value xml
Spring 3以后,支持@Value注解的方式获取properties文件中的配置值，简化了读取配置文件的复杂操作 1、在applicationContext.xml文件(或引用文件中)中配置properties文件 <bean id="appProperty" class="org.springframework.beans.fac
mongoDB 分片开窍的石头 mongodb
mongoDB的分片。要mongos查询数据时候先查询configsvr看数据在那台shard上，configsvr上边放的是metar信息，指的是那条数据在那个片上。由此可以看出mongo在做分片的时候咱们至少要有一个configsvr,和两个以上的shard（片）信息。第一步启动两台以上的mongo服务 &nb
OVER(PARTITION BY)函数用法 0624chenhong oracle
这篇写得很好，引自 http://www.cnblogs.com/lanzi/archive/2010/10/26/1861338.html OVER(PARTITION BY)函数用法 2010年10月26日 OVER(PARTITION BY)函数介绍开窗函数 &nb
Android开发中，ADB server didn't ACK 解决方法一炮送你回车库 Android开发
首先通知：凡是安装360、豌豆荚、腾讯管家的全部卸载，然后再尝试。一直没搞明白这个问题咋出现的，但今天看到一个方法，搞定了！原来是豌豆荚占用了 5037 端口导致。参见原文章：一个豌豆荚引发的血案——关于ADB server didn't ACK的问题简单来讲，首先将Windows任务进程中的豌豆荚干掉，如果还是不行，再继续按下列步骤排查。 &nb
canvas中的像素绘制问题换个号韩国红果果 JavaScript canvas
pixl的绘制，1.如果绘制点正处于相邻像素交叉线，绘制x像素的线宽，则从交叉线分别向前向后绘制x/2个像素，如果x/2是整数，则刚好填满x个像素，如果是小数，则先把整数格填满，再去绘制剩下的小数部分，绘制时，是将小数部分的颜色用来除以一个像素的宽度，颜色会变淡。所以要用整数坐标来画的话（即绘制点正处于相邻像素交叉线时），线宽必须是2的整数倍。否则会出现不饱满的像素。 2.如果绘制点为一个像素的
编码乱码问题灵静志远 java jvm jsp 编码
1、JVM中单个字符占用的字节长度跟编码方式有关，而默认编码方式又跟平台是一一对应的或说平台决定了默认字符编码方式；2、对于单个字符：ISO-8859-1单字节编码，GBK双字节编码，UTF-8三字节编码；因此中文平台(中文平台默认字符集编码GBK)下一个中文字符占2个字节，而英文平台(英文平台默认字符集编码Cp1252(类似于ISO-8859-1))。 3、getBytes()、getByte
java 求几个月后的日期 darkranger calendar getinstance
Date plandate = planDate.toDate(); SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd"); Calendar cal = Calendar.getInstance(); cal.setTime(plandate); // 取得三个月后时间 cal.add(Calendar.M
数据库设计的三大范式（通俗易懂） aijuans 数据库复习
关系数据库中的关系必须满足一定的要求。满足不同程度要求的为不同范式。数据库的设计范式是数据库设计所需要满足的规范。只有理解数据库的设计范式，才能设计出高效率、优雅的数据库，否则可能会设计出错误的数据库. 目前，主要有六种范式：第一范式、第二范式、第三范式、BC范式、第四范式和第五范式。满足最低要求的叫第一范式，简称1NF。在第一范式基础上进一步满足一些要求的为第二范式，简称2NF。其余依此类推。
想学工作流怎么入手 atongyeye jbpm
工作流在工作中变得越来越重要，很多朋友想学工作流却不知如何入手。很多朋友习惯性的这看一点，那了解一点，既不系统，也容易半途而废。好比学武功，最好的办法是有一本武功秘籍。研究明白，则犹如打通任督二脉。系统学习工作流，很重要的一本书《JBPM工作流开发指南》。本人苦苦学习两个月，基本上可以解决大部分流程问题。整理一下学习思路，有兴趣的朋友可以参考下。 1 首先要
Context和SQLiteOpenHelper创建数据库百合不是茶 android Context创建数据库
一直以为安卓数据库的创建就是使用SQLiteOpenHelper创建,但是最近在android的一本书上看到了Context也可以创建数据库,下面我们一起分析这两种方式创建数据库的方式和区别,重点在SQLiteOpenHelper 一:SQLiteOpenHelper创建数据库: 1,SQLi
浅谈group by和distinct bijian1013 oracle 数据库 group by distinct
group by和distinct只了去重意义一样，但是group by应用范围更广泛些，如分组汇总或者从聚合函数里筛选数据等。譬如：统计每id数并且只显示数大于3 select id ,count(id) from ta
vi opertion 征客丶 mac opration vi
进入 command mode （命令行模式）按 esc 键再按 shift + 冒号注：以下命令中带 $ 【在命令行模式下进行】，不带 $ 【在非命令行模式下进行】一、文件操作 1.1、强制退出不保存 $ q! 1.2、保存 $ w 1.3、保存并退出 $ wq 1.4、刷新或重新加载已打开的文件 $ e 二、光标移动 2.1、跳到指定行数字
【Spark十四】深入Spark RDD第三部分RDD基本API bit1129 spark
对于K/V类型的RDD,如下操作是什么含义？ val rdd = sc.parallelize(List(("A",3),("C",6),("A",1),("B",5)) rdd.reduceByKey(_+_).collect reduceByKey在这里的操作，是把
java类加载机制 BlueSkator java 虚拟机
java类加载机制 1.java类加载器的树状结构引导类加载器 ^ | 扩展类加载器 ^ | 系统类加载器 java使用代理模式来完成类加载，java的类加载器也有类似于继承的关系，引导类是最顶层的加载器，它是所有类的根加载器，它负责加载java核心库。当一个类加载器接到装载类到虚拟机的请求时，通常会代理给父类加载器，若已经是根加载器了，就自己完成加载。虚拟机区分一个Cla
动态添加文本框 BreakingBad 文本框
<script> var num=1; function AddInput() { var str=""; str+="<input
读《研磨设计模式》-代码笔记-单例模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ public class Singleton { } /* * 懒汉模式。注意，getInstance如果在多线程环境中调用，需要加上synchronized，否则存在线程不安全问题 */ class LazySingleton
iOS应用打包发布常见问题 chenhbc ios iOS发布 iOS上传 iOS打包
这个月公司安排我一个人做iOS客户端开发，由于急着用，我先发布一个版本，由于第一次发布iOS应用，期间出了不少问题，记录于此。 1、使用Application Loader 发布时报错：Communication error.please use diagnostic mode to check connectivity.you need to have outbound acc
工作流复杂拓扑结构处理新思路 comsci 设计模式工作算法企业应用 OO
我们走的设计路线和国外的产品不太一样，不一样在哪里呢？国外的流程的设计思路是通过事先定义一整套规则(类似XPDL)来约束和控制流程图的复杂度(我对国外的产品了解不够多，仅仅是在有限的了解程度上面提出这样的看法)，从而避免在流程引擎中处理这些复杂的图的问题，而我们却没有通过事先定义这样的复杂的规则来约束和降低用户自定义流程图的灵活性，这样一来，在引擎和流程流转控制这一个层面就会遇到很
oracle 11g新特性Flashback data archive daizj oracle
1. 什么是flashback data archive Flashback data archive是oracle 11g中引入的一个新特性。Flashback archive是一个新的数据库对象，用于存储一个或多表的历史数据。Flashback archive是一个逻辑对象，概念上类似于表空间。实际上flashback archive可以看作是存储一个或多个表的所有事务变化的逻辑空间。
多叉树:2-3-4树 dieslrae 树
平衡树多叉树,每个节点最多有4个子节点和3个数据项,2,3,4的含义是指一个节点可能含有的子节点的个数,效率比红黑树稍差.一般不允许出现重复关键字值.2-3-4树有以下特征: 1、有一个数据项的节点总是有2个子节点(称为2-节点) 2、有两个数据项的节点总是有3个子节点(称为3-节
C语言学习七动态分配 malloc的使用 dcj3sjt126com c language malloc
/* 2013年3月15日15:16:24 malloc 就memory(内存) allocate(分配)的缩写本程序没有实际含义，只是理解使用 */ # include <stdio.h> # include <malloc.h> int main(void) { int i = 5; //分配了4个字节静态分配 int * p
Objective-C编码规范[译] dcj3sjt126com 代码规范
原文链接 : The official raywenderlich.com Objective-C style guide 原文作者 : raywenderlich.com Team 译文出自 : raywenderlich.com Objective-C编码规范译者 : Sam Lau
0.性能优化-目录 frank1234 性能优化
从今天开始笔者陆续发表一些性能测试相关的文章，主要是对自己前段时间学习的总结，由于水平有限，性能测试领域很深，本人理解的也比较浅，欢迎各位大咖批评指正。主要内容包括：一、性能测试指标吞吐量、TPS、响应时间、负载、可扩展性、PV、思考时间 http://frank1234.iteye.com/blog/2180305 二、性能测试策略生产环境相同基准测试预热等 htt
Java父类取得子类传递的泛型参数Class类型 happyqing java 泛型父类子类 Class
import java.lang.reflect.ParameterizedType; import java.lang.reflect.Type; import org.junit.Test; abstract class BaseDao<T> { public void getType() { //Class<E> clazz =
跟我学SpringMVC目录汇总贴、PDF下载、源码下载 jinnianshilongnian springMVC
----广告-------------------------------------------------------------- 网站核心商详页开发掌握Java技术，掌握并发/异步工具使用，熟悉spring、ibatis框架；掌握数据库技术，表设计和索引优化，分库分表/读写分离；了解缓存技术，熟练使用如Redis/Memcached等主流技术；了解Ngin
the HTTP rewrite module requires the PCRE library 流浪鱼 rewrite
./configure: error: the HTTP rewrite module requires the PCRE library. 模块依赖性Nginx需要依赖下面3个包 1. gzip 模块需要 zlib 库 ( 下载: http://www.zlib.net/ ) 2. rewrite 模块需要 pcre 库 ( 下载: http://www.pcre.org/ ) 3. s
第12章 Ajax（中） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Optimize query with Query Stripping in Web Intelligence blueoxygen BO
http://wiki.sdn.sap.com/wiki/display/BOBJ/Optimize+query+with+Query+Stripping+in+Web+Intelligence and a very straightfoward video http://www.sdn.sap.com/irj/scn/events?rid=/library/uuid/40ec3a0c-936
Java开发者写SQL时常犯的10个错误 tomcat_oracle java sql
1、不用PreparedStatements 　　有意思的是，在JDBC出现了许多年后的今天，这个错误依然出现在博客、论坛和邮件列表中，即便要记住和理解它是一件很简单的事。开发者不使用PreparedStatements的原因可能有如下几个：　　他们对PreparedStatements不了解　　他们认为使用PreparedStatements太慢了　　他们认为写Prepar
世纪互联与结盟有感阿尔萨斯
10月10日，世纪互联与（Foxcon）签约成立合资公司，有感。全球电子制造业巨头（全球500强企业）与世纪互联共同看好IDC、云计算等业务在中国的增长空间，双方迅速果断出手，在资本层面上达成合作，此举体现了全球电子制造业巨头对世纪互联IDC业务的欣赏与信任，另一方面反映出世纪互联目前良好的运营状况与广阔的发展前景。众所周知，精于电子产品制造（世界第一），对于世纪互联而言，能够与结盟

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他