xiangz_csdn

开源数据库最全盘点

[转] http://www.leiphone.com/news/201702/Can849ZwMlp66QBR.html

开发 AI 和机器学习系统从来没有像现在这样方便。类似于 TensorFlow、Torch 和 Spark 这样的开源工具，在 AI 开发者群体中已是无处不在。再加上亚马逊 AWS、Google Cloud 等云服务带来的海量计算能力，将来使用笔记本电脑来训练 ML 模型或许不再难以想象。

公众对 AI 的遐想，总忽视了数据的角色。但海量被标记、注解过的数据，是当下 AI 革命当之无愧的主要推手之一。业内研究团队和公司机构，均明白“数据民主化”的意义——使任何开发者都能获取高质量的数据来训练、测试模型，是加速 AI 技术发展的必要措施。

但就雷锋网所知，大多数涉及机器学习和 AI 的产品依赖于专有数据库（ proprietary datasets）。它们大多是不被公开的，以保护知识产权以及防范安全风险。

即便你幸运地找到了相关公共数据库，判断后者的价值和可靠程度，又是一项让很多开发者头痛的问题。对于概念论证是如此；对于潜在的产品或者特性验证同样如此——在收集你的专有数据之前，决定该验证需要何种数据集。

有经验的开发者都知道，机器学习系统在样本数据集上展示出的优异性能，并不能保证其实际效果。许多 AI 从业人员似乎已经忘记了，数据采集和标记才是开发 AI 解决方案最难的一环。标准的数据集，可被用作验证集，或作为开发更偏向私人订制方案的起始点。

本周，Vai Technologies 的创始人、前斯坦福 SLAC 实验室 CNN 算法架构师 Luke de Oliveira，和其他几名机器学习专家谈到了这个问题。雷锋网(公众号：雷锋网)了解到，他们最后决定做一张表单，把 AI 领域含金量最高的开源数据库罗列出来，与大家分享。

计算机视觉

MNIST

标签：学术基准经典较旧

合理性测试（sanity check）最常用的数据库。规格为 25x25、中心的、B&W 手写数字。用 MNIST 测试非常容易，但不要因为你的模型在 MNIST 运行良好，就认为它事实上可用。

地址：https://pjreddie.com/projects/mnist-in-csv/

CIFAR 10 & CIFAR 100

标签：经典较旧

32x32 彩色图像。虽然用得人比以前少了很多，但仍然能用它做有趣的合理性测试。

地址：https://www.cs.toronto.edu/~kriz/cifar.html

ImageNet

标签：实用学术基准经典

这个用不着介绍，新算法的首选图像数据集。Luke de Oliveira 表示，许多图像 API 公司从 REST 交互界面搞来的标记，与 ImageNet 1000 目录中的 WordNet 层级很接近，让人怀疑。

地址：http://image-net.org/

LSUN

标签：无

场景理解，许多其它附加任务（比如房间布局预估，显着性预测 “saliency prediction”），以及与之关联的竞赛。

地址：http://lsun.cs.princeton.edu/2016/

PASCAL VOC

标签：学术基准

一般性的图像分割和分类。对于创建现实世界中的图像注解并不是十分有用，但作为基准很不错。

地址：http://host.robots.ox.ac.uk/pascal/VOC/

SVHN

标签：学术基准

谷歌街景视图中的住宅号。可以把它当做野生的递归（ recurrent） MNIST。

地址：http://ufldl.stanford.edu/housenumbers/

MS COCO

标签：无

一般性的图像理解/说明，有相关竞赛。

地址：http://mscoco.org/

Visual Genome

标签：实用

非常细致的视觉知识库，对超过十万张图像有深度注解。

地址：http://visualgenome.org/

Labeled Faces in the Wild

标签：实用学术基准经典较旧

修剪过的面部区域（使用 Viola-Jones），用一个 name identifier 做过标记。其中每一个展示的人在数据集中有两个图像，这是作为他的子集。开发者经常用它来训练面部匹配系统。

地址：http://vis-www.cs.umass.edu/lfw/

自然语言

Text Classification Datasets

标签：实用学术基准

来自论文 Zhang et al., 2015。这是有八个文字分类数据集组成的大型数据库。对于新的文字分类基准，它是最常用的。样本大小为 120K 到 3.6M，包括了从二元到 14 阶的问题。来自 DBPedia, Amazon, Yelp, Yahoo!，搜狗和 AG 的数据集。

地址：https://drive.google.com/drive/u/0/folders/0Bz8a_Dbh9Qhbfll6bVpmNUtUcFdjYmF2SEpmZUZUcVNiMUw1TWN6RDV3a0JHT3kxLVhVR2M

WikiText

标签：实用学术基准

源自高品质维基百科文章的大型语言建模语料库。Salesforce MetaMind 维护。

地址：http://metamind.io/research/the-wikitext-long-term-dependency-language-modeling-dataset/

Question Pairs

标签：实用

Quora 发布的第一个数据集，包含副本/语义近似值标记。

地址：https://data.quora.com/First-Quora-Dataset-Release-Question-Pairs

SQuAD

标签：实用学术基准

斯坦福的问答社区数据集——适用范围较广的问题回答和阅读理解数据集。每一个回答都被作为一个 span，或者一段文本。

地址：https://rajpurkar.github.io/SQuAD-explorer/

CMU Q/A Dataset

标签：无

人工创建的仿真陈述问题/回答组合，还有维基百科文章的难度评分。

地址：http://www.cs.cmu.edu/~ark/QA-data/

Maluuba Datasets

标签：实用

为 NLP 研究人工创建的复杂数据集。

地址：https://datasets.maluuba.com/

Billion Words

标签：实用学术基准

大型、通用型建模数据集。时常用来训练散布音（distributed）的词语表达，比如 word2vec 或 GloVe。

地址：http://www.statmt.org/lm-benchmark/

Common Crawl

标签：实用学术基准

PB（拍字节）级别的网络爬虫。最经常被用来学习词语嵌入。可从 Amazon S3 免费获取。对于 WWW 万维网的信息采集，是一个比较有用的网络数据集。

地址：http://commoncrawl.org/the-data/

bAbi

标签：学术基准经典

Facebook AI Research (FAIR) 推出的合成阅读理解和问题回答数据集。

地址：https://research.fb.com/projects/babi/

The Children's Book Test

标签：学术基准

Project Gutenberg（一项正版数字图书免费分享工程）儿童图书里提取的成对数据（问题加情境，回答）基准。对问答、阅读理解、仿真陈述（factoid）查询比较有用。

地址：https://research.fb.com/projects/babi/

Stanford Sentiment Treebank

标签：学术基准经典较旧

标准的情绪数据集，对每一句话每一个节点的语法树，都有细致的情感注解。

地址：http://nlp.stanford.edu/sentiment/code.html

20 Newsgroups

标签：经典较旧

一个较经典的文本分类数据集。通常作为纯粹分类或者对 IR / indexing 算法验证的基准，在这方面比较有用。

地址：http://qwone.com/~jason/20Newsgroups/

Reuters

标签：经典较旧

较老的、基于纯粹分类的数据集。文本来自于路透社新闻专线。常被用于教程之中。

地址：https://archive.ics.uci.edu/ml/datasets/Reuters-21578+Text+Categorization+Collection

IMDB

标签：经典较旧

较老的、相对比较小的数据集。用于情绪分类。但在文学基准方面逐渐失宠，让位于更大的数据集。

地址：http://ai.stanford.edu/~amaas/data/sentiment/

UCI’s Spambase

标签：经典较旧

较老的、经典垃圾邮件数据集，源自于 UCI Machine Learning Repository。由于数据集的管理细节，在学习私人订制垃圾信息过滤方面，这会是一个有趣的基准。

地址：https://archive.ics.uci.edu/ml/datasets/Spambase

语音

大多数语音识别数据库都是专有的——这些数据对其所有公司而言有巨大价值。绝大部分该领域的公共数据集已经很老了。

2000 HUB5 English

标签：学术基准较旧

只包含英语的语音数据。最近一次被使用是百度的深度语音论文。

地址：https://catalog.ldc.upenn.edu/LDC2002T43

LibriSpeech

标签：学术基准

有声图书数据集，包含文字和语音。接近 500 个小时的清楚语音，来自于多名朗读者和多个有声读物，根据图书章节来组织。

地址：http://www.openslr.org/12/

VoxForge

标签：实用学术基准

带口音英语的清晰语音数据集。如果你需要有强大的不同口音、语调识别能力，会比较有用。

地址：http://www.voxforge.org/

TIMIT

标签：学术基准经典

只含英语的语音识别数据集。

地址：https://catalog.ldc.upenn.edu/LDC93S1

CHIME

标签：实用

含大量噪音的语音识别挑战杯数据集。它包含真实、模拟和清晰的录音：真实，是因为该数据集包含四个说话对象在四个不同吵闹环境下接近 9000 段的录音；模拟，是通过把多个环境与语音结合来生成；清晰，是指没有噪音的清楚录音。

地址：http://spandh.dcs.shef.ac.uk/chime_challenge/data.html

TED-LIUM

标签：无

TED 演讲的音频转录。包含 1495 场 TED 演讲，以及它们的完整字幕文本。

地址：http://www-lium.univ-lemans.fr/en/content/ted-lium-corpus

推荐和排名系统

Netflix Challenge

标签：经典较旧

第一个 Kaggle 模式的数据挑战。由于盗版问题只能获得非官方版本。

地址：http://www.netflixprize.com/

MovieLens

标签：实用学术基准经典

不同大小的电影点评数据——一般作为协同过滤的基准。

地址：https://grouplens.org/datasets/movielens/

Million Song Dataset

标签：无

Kaggle 上的大型、富含原数据的开源数据集。对于试验混合推荐系统有价值。

地址：https://www.kaggle.com/c/msdchallenge

Last.fm

标签：实用

音乐推荐数据集，并关联相关社交网络和其他元数据。对混合系统有用处。

地址：http://grouplens.org/datasets/hetrec-2011/

网络和图

Amazon Co-Purchasing 和 Amazon Reviews

标签：学术基准

从亚马逊“买了这个的用户还买了XXX”功能抓取的数据，还有相关商品的评价数据。对于试验网络中的推荐系统有价值。

地址：http://snap.stanford.edu/data/#amazon

http://snap.stanford.edu/data/amazon-meta.html

Friendster 社交网络数据集

标签：无

在成为游戏网站之前，Friendster 发布了 103,750,348 名用户朋友名单的匿名数据。

地址：https://archive.org/details/friendster-dataset-201107

地理空间数据

OpenStreetMap

标签：实用

整个地球的矢量数据，处于免费协议下。它的旧版本包含美国人口统计部门的 TIGER 数据。

地址：http://wiki.openstreetmap.org/wiki/Planet.osm

Landsat8

标签：实用

整个地球表面的卫星拍照，每隔几周更新一次。

地址：https://landsat.usgs.gov/landsat-8

NEXRAD

标签：实用

多普勒天气雷达对美国大气情况的扫描。

地址：https://www.ncdc.noaa.gov/data-access/radar-data/nexrad

后话

人们经常认为，能在一个数据集上解决问题，就等同于有了一个能用的产品。开发者可以使用这些数据集作为验证集，或用作概念论证；但别忘了测试，或创建模拟产品运行的原型机。获取更新、更真实的数据来改善模型非常关键。雷锋网了解到，成功的数据驱动型公司，往往擅长收集新的专有数据，以及改善产品性能增强竞争优势。而这往往是竞争对手难以直接 copy 的。

via medium

相关文章：

2017年，开发者需要关注哪些AI国际峰会？看这篇就够了

你可能感兴趣的:(技术信息)

有花堪折直须折，莫待无花空折枝 4763f7988cd1
通化883徐敬霞2019年的暑假，我有幸参加了兴成长暑期培训“教育技术信息化2.0能力素养提升”。听课，打卡，让我收获满满，感受多多！图片发自App带着愉悦的心情我共听了七节课，首先是王子老师《微信小程序的创新应用》，唐晓勇校长《技术支持下的学习变革》，梁勇校长《教学PPT的设计与制作》，王思思老师的《跨学科视野下的自然笔记》，朱思思老师的《教学实践中的思维导图》，陈晓粧老师的《学习类PPT的教学
NCBI BLAST+：分析生物内在编码的工具 belldeep 生物信息学 Blast 生物数据分析
在生物信息学的广阔领域中，NCBI（NationalCenterforBiotechnologyInformation，美国国立生物技术信息中心）开发的BLAST（BasicLocalAlignmentSearchTool，基本局部比对搜索工具）无疑是一把不可或缺的分析工具。NCBIBLAST+，作为其最新版本2.16.0+，为科研工作者提供了一套强大的序列比对和搜索功能，帮助解析生命现象背后的遗
GB-T 43206-2023 信息安全技术信息系统密码应用测评要求 securitypaper 数据库服务器运维
GB-T43206-2023信息安全技术信息系统密码应用测评要求编写背景随着信息技术的飞速发展，信息系统在社会经济活动中扮演着越来越重要的角色。信息安全问题也随之成为社会关注的焦点。GB-T43206-2023《信息安全技术信息系统密码应用测评要求》是针对信息系统中密码应用的安全性进行评估和测试的国家标准。该标准旨在指导和规范信息系统密码应用的安全测评工作，确保信息系统的安全性和可靠性。面向用户本
openai公司的chatgpt-3.5参数库内还未增加sora的语料信息 yrldjsbk 神经网络技术 gpt-3 人工智能深度学习
openai公司的chatgpt-3.5参数库内还未增加sora的语料信息！我想通过openai公司的chatgpt3.5来了解一下关于sora的技术信息，结果呢，它竟然回答不知道sora是什么。看来，sora的语料库信息还未来得及加入chatgpt3.5的训练模型中。如图，chatgpt3.5回答了，说它不知道。以后我会陆续和大家分享，各种前言的大数据模型技术信息，以及和人工智能，神经网络技术有
关于Sora的一些紧迫问题... AI生成未来 chatgpt sora sora模型 AIGC
OpenAISora概述OpenAI最新的创新，Sora，在人工智能领域开辟了新的天地。Sora是一个文本到视频的扩散模型，可以将文本描述转化为逼真的视频内容。它解决了一个重大的技术挑战，即在视频中保持主体的一致性，即使它们暂时移出画面。Sora利用先进的技术将静态噪音转化为清晰连贯的一分钟视频。它能够提前预测多个帧，实现视频形式中的无缝过渡和稳定叙事。技术信息：类型：生成式人工智能主要功能：将文
专业课147总420+福州大学866信号与系统考研经验福大电子信息技术信息与通信一个通信老学姐博睿泽信息通信考研论坛博睿泽信息通信考研考研信息与通信信号处理经验分享
我本人一战双非上岸福大，初试分数420+，期中专业课866信号与系统147（有点遗憾没有达到信息通信考研Jenny老师辅导班要求的满分）。这里想分享一些自己准备初试的过程和一些学习方法，希望能给各位准备报考福州大学866的学弟学妹们提供一些帮助和复习的参考。专业课福州大学专业课是866信号系统，在之前的年份比较简单，从22年开始难度上升计算量也加大。都是计算题，除去前面的五道小题，每道大题分值都在
分析网站架构：浏览器插件香甜可口草莓蛋糕信息收集网络安全系统安全 web安全安全安全架构网络攻击模型安全威胁分析
一、Wappalyzer1.1介绍Wappalyzer是一款用于识别网站所使用技术栈的浏览器插件。它能够分析正在浏览的网页，检测出网站所使用的各种技术和框架，如内容管理系统（CMS）、JavaScript库、Web服务器等。用户只需安装Wappalyzer插件，就能在访问网页时获得关于该网站使用的技术信息。以下是Wappalyzer的一些特点和功能：技术识别：Wappalyzer能够识别包括但不限
专业148总分400+福州大学866信号与系统考研经验福大电子信息技术信息与通信一个通信老学姐博睿泽信息通信考研论坛博睿泽信息通信考研考研信息与通信经验分享信号处理
经历大半年的复习，今年顺利上岸福州大学，今年考研专业课866信号与系统148，总分400+，各门发挥稳定，下面总结一下自己这大半年复习的经历和得失经验，希望对大家复习有所帮助。专业课：866信号与系统是我投入时间和精力最多的科目。最后成绩出来148分也是有点超出自己预期，平时在Jenny老师辅导班模考一般都在120-135左右（模考试卷都难于福大的真题不少），今年专业课做的很顺手，所有内容Jenn
侵犯商业秘密罪律师：以芯片布图设计为例，谈技术公开与无罪思路 8285f8ec4ba8
作者：何国铭律师（专于商标犯罪与商业秘密犯罪案件研究与辩护）据不完全统计，约80%侵犯商业秘密犯罪案件涉及企业员工或者前员工。涉案人员多是高级管理人员或曾在核心技术岗位任职，利用接触核心技术信息或者经营信息的便利侵犯老东家的商业秘密。常说挖人才就是挖技术，人才流通加快加剧了商业竞争，同时也增加商业秘密被侵犯的风险。导致商业秘密被侵犯的原因有很多，当今常见的侵权方式如高管离职后自主创业，经营与原企业
生物信息网站集合庐山星晖
1.常用门户：美国国家生物技术信息中心(NCBI)：https://www.ncbi.nlm.nih.gov欧洲生物信息学研究所(EMBL-EBI)：https://www.ebi.ac.ukUCSCGenome：http://genome.ucsc.edu国际生物信息学动态及会议：http://www.bioinformatics.orgSeqAnswer国际生物信息技术问答论坛：http://
经验 | UI设计要了解的10个前端知识不错研究室
请关注不错研究室在公司项目中，设计师了解前端，会极大提升和程序员的协作效率，减少技术信息不对称的现象。如果在一个网站项目中，程序员还在跟设计师讲解最基本的html、css、盒子模型知识，那开发效率就可想而知了。很多公司的项目，都采用了前端框架来开发，如果设计师了解这些框架，能在框架的结构基础上进行UI设计，那无疑会提高项目整体的开发效率。下面就一起了解下常见的前端框架，说不定面试的时候能帮大忙。A
讲解：JavaDNAProgramming AssignmentJava rbqdgy0
Introduction此作业着重于数组和文件/文本处理。打开一个名为DNA.java的文件。您还需要课程网站上的两个输入文件dna.txt和ecoli.txt。将这些文件保存在与您的程序相同的文件夹中。分配涉及处理来自基因组文件的数据。你的程序应该与两个给定的输入文件一起工作。如果你很好奇（这不是必需的），国家生物技术信息中心出版了许多其他细菌基因组文件。最后一页告诉你如何使用你的程序来处理其他
软件设计师中级- 系统安全分析与设计小鑫同學软件设计师中级系统安全网络安全
系统安全分析与设计信息系统安全属性对称加密技术非对称加密技术信息摘要数字签名数字信封与PGP设计邮件加密系统网络安全各个网络层次的安全保障网络威胁与攻击防火墙
SCI、EI、ISTP收录检索技巧及核心期刊投稿导引 eisci2528265908 SCI EI SSCI
三大检索工具(SCI、EI、ISTP)收录检索技巧及核心期刊投稿导引一.三大检索工具及相关数据库介绍1.三大检索工具简介科技部下属的“中国科学技术信息研究所”从1987年起,每年以国外四大检索工具SCI、ISTP、Ei、ISR为数据源进行学术排行。由于ISR(《科学评论索引》)收录的论文与SCI有较多重复，且收录我国的论文偏少。因此，1993年起不再把ISR作为论文的统计源。而其中的SCI、IST
我心中的好老师远航小诗
我心中的好老师学识渊博，他们总能解答学生的疑难问题，满足学生的好奇心。我心中的好老师具备丰富的专业知识，有激情，能根据学生的年龄心理特征进行教学活动，创建生动活泼的课堂吸引学生，激发学生的求知欲。我心中的好老师有爱心，有高尚的道德情操，有宽广的胸怀，他们为人师表，既教书又育人。我心中的好老师有进取精神，在知识大爆炸科学技术信息技术日新月异的年代，不断给自己充电，更新知识，抛弃陈旧和过时的教学方法，
演讲实践要怎么开展？《全脑演讲：左脑逻辑，右脑情商》经典摘要（8）晴朗花半
演讲实践要怎么开展？（一）自我介绍我是谁？有何不同？何以见得？运用STAR法则讲故事，S——背景；T——任务；A——行动；R——结果（二）产品介绍介绍产品细节利用产品的爽点痛点打动观众阐述产品故事，励志的故事；品牌的故事；情感的故事；④产品的故事（三）技术演讲在技术演讲的过程中，保持空杯心态，用“新手思维”去演讲。不要假设听众了解专业词汇。尽可能用最简单最生动的语言。把技术信息转化成听众熟悉的概念
医院信息化的核心-云HIS系统星辰大海里编程云HIS系统源码 HIS
基于云计算技术的B/S架构的HIS系统，为基层医疗机构提供标准化的、信息化的、可共享的医疗信息管理系统，实现医患事务管理和临床诊疗管理等标准医院管理信息系统的功能。系统利用云计算平台的技术优势，建立统一的健康档案存储平台，有效实现医疗数据共享与交换，解决数据重复采集及信息孤岛等问题，为实现区域医院卫生信息化平台奠定了基础。概述在互联网技术信息化的进程中，医院已进入了数字化和信息化时代，作为医院信息
基于深度学习的篮球战术数据自动采集技术研究——项目展示 Iubco_cc 人工智能机器学习深度学习计算机视觉
1项目背景篮球运动除了需要统计如2分投中、2分投篮、3分投中、3分投篮、扣篮、助攻、盖帽、抢断、失误、犯规和得分等技术信息,还需要统计战术信息。现在统计工作大多数是通过手工完成的,这样的统计方式存在着一些缺点,如统计速度比较慢、统计的信息不全面、只能够统计一些简单信息、无法统计出每一次进攻或防守中球员的运动路线和篮球落点等。除了统计技战术数据外,教练员和运动员有时候还需要通过观看某个球队的某一场比
24年初级会计资格考试报名信息采集流程共10大步骤，千万不要搞错爱分享的淘金达人 java
2024年初级会计资格考试报名信息采集流程共10大步骤，不要搞错哦；第一步：输入证件号、点击登录第二步：阅读采集须知第三步：填写个人信息（支付宝搜索"亿鸣证件照"或者微信搜索"随时照"制作考试报名需要的高清证件照）第四步：填写学历信息第五步：填写工作信息第六步：填写专业技术信息第七步：填写奖励信息第八步：提交，完成信息采集第九步：查看采集状态第十步：信息变更
侵犯商业秘密罪律师：商业秘密被侵犯？谈谈委托鉴定那些事 8285f8ec4ba8
作者：何国铭律师（专于商标犯罪与商业秘密犯罪案件研究及辩护）接下来，我们重点谈谈大部分权利人最关心的委托鉴定问题？商业秘密可分为两类，一是技术信息类，二是经营信息类。对于经营信息类商业秘密案件，我们认为是无需进行司法鉴定的，经营信息是否属于商业秘密系规范性判断，办案人员根据常识、常情、常理及相关的司法解释进行分析判断即可。由此，我们所谈的鉴定是针对技术信息的鉴定。技术信息的鉴定可分为“非公知性”鉴
迅软科技助力高科技防泄密：从华为事件中汲取经验教训迅软科技总部科技
近期，涉及华为芯片技术被窃一事引起广泛关注。据报道，华为海思的两个高管张某、刘某离职后成立尊湃通讯，然后以支付高薪、股权支付等方式，诱导多名海思研发人员跳槽其公司，并指使这些人员在离职前通过摘抄、截屏等方式窃取华为海思芯片技术信息。经过专业技术鉴定，侵权芯片技术有40个技术点与权利公司商业秘密的密点具有90%以上同一性，构成实质性相同。尊湃通讯被确认窃取了华为海思的技术，其主要负责人目前无法联系，
解锁商业宝藏：迅软科技答疑保护商业秘密的重要性迅软科技总部科技
商业秘密指不为公众所知悉、具有商业价值并经权利人采取相应保密措施的技术信息、经营信息等商业信息，一旦泄露可能会给公司带来极大的经济损失和竞争压力，保护商业秘密既能维护企业自身合法权益，也能保障市场经济长期健康发展需求。保护商业秘密的重要性一、竞争优势：商业秘密可能包括独特的生产过程、创新技术、客户清单、市场策略等信息，这些信息是企业在市场上保持竞争优势的关键。保护这些秘密有助于确保其他公司无法轻易
Redis 对象共享、内存回收、空转时长杰哥长得帅
内存回收C语言不具备内存回收功能，所以Redis构建了一个由引用计数实现的内存回收机制，通过这一机制，程序可以通过跟踪对象的引用技术信息，在适当的时候自动释放对象并进行内存回收每个对象的引用计数信息由redisObject结构的refcount属性记录：对象的引用计数信息会随着对象的使用状态而不断变化：当创建一个新对象时，引用计数的值会被初始化为1当对象被一个新程序使用时，引用计数值会加一当对象不
我心目中的好老师稳稳的幸福_c9df
我心中的好老师学识渊博，他们总能解答学生的疑难问题，满足学生的好奇心。我心中的好老师具备丰富的专业知识，有激情，能根据学生的年龄心理特征进行教学活动，创建生动活泼的课堂吸引学生，激发学生的求知欲。我心中的好老师有爱心，有高尚的道德情操，有宽广的胸怀，他们为人师表，既教书又育人。我心中的好老师有进取精神，在知识大爆炸科学技术信息技术日新月异的年代，不断给自己充电，更新知识，抛弃陈旧和过时的教学方法，
能量和信息朱文峰
能量主线研究科学技术信息主线研究科学技术重组能量和信息能量密度游牧-农耕文明工业革命文明电动汽车，
【4】密评-网络和通信安全测评司徒荆商用密码应用安全性评估密评商用密码
0x01依据GB/T39786-2021《信息安全技术信息系统密码应用基本要求》针对等保三级系统要求：网络和通信层面：a）应采用密码技术对通信实体进行身份鉴别，保证通信实体身份的真实性；b）宜采用密码技术保证通信过程中数据的完整性；c）应采用密码技术保证通信过程中重要数据的机密性；d）宜采用密码技术保证网络边界访问控制信息的完整性；e）可采用密码技术对从外部连接到内部网络的设备进行接入认证，确保接
【3】密评-物理和环境安全测评司徒荆商用密码应用安全性评估密评商用密码物理和环境安全
0x01依据GB/T39786-2021《信息安全技术信息系统密码应用基本要求》针对等保三级系统要求：物理和环境层面：a）宜采用密码技术进行物理访问身份鉴别,保证重要区域进入人员身份的真实性；b）宜采用密码技术保证电子门禁系统进出记录数据的存储完整性；c）宜采用密码技术保证视频监控音像记录数据的存储完整性；0x02测评实施a）宜采用密码技术进行物理访问身份鉴别,保证重要区域进入人员身份的真实性；1
今日实施｜解读新国标对数据库审计的能力要求数据库安全数据库 php 开发语言
数据库审计是数据安全建设不可或缺的技术工具之一，无论是国家级的法律或标准，还是等保以及行业级的安全标准均对使用数据库审计有明确要求。据相关数据统计显示，数据库审计产品的市场需求已占据中国数据库安全市场容量的6成以上。12月1日，GB/T20945-2023《信息安全技术网络安全审计产品技术规范》正式实施。该标准全面替代GB/T20945-2013《信息安全技术信息系统安全审计产品技术要求和测试评价
律师：以同一性鉴定为例，谈侵犯商业秘密罪之无罪思路 8285f8ec4ba8
作者：何国铭律师（专于商标犯罪与商业秘密犯罪案件研究及辩护）商业秘密是一个蕴含事实认定与价值判断的概念，商业秘密的认定既存在专业技术问题，又存在法律问题，既有事实判断，也有价值判断。商业秘密中的价值性及保密性问题，则属于价值判断、规范性判断，办案人员可综合被害人投入的研发成本、市场竞争优势、预期及既得的收益等因素判断争议的技术信息是否具有价值性，保密性则可以由办案人员根据被害人是否采取了保密措施来
GEO数据库下载翾格格
GEO（GENEEXPRESSIONOMNIBUS），https://www.ncbi.nlm.nih.gov/geo/，由美国国立生物技术信息中心NCBI创建维护的，是个公开的基因数据库，包含了测序和芯片数据。在前面，我们介绍过利用GEO数据库进行芯片数据检索，今天我们再进一步细化，如何利用GEO数据库下载信息。GEO数据包括五种，platforms、samples、series、dataset
Js函数返回值 _wy_ js return
一、返回控制与函数结果，语法为：return 表达式;作用: 结束函数执行，返回调用函数，而且把表达式的值作为函数的结果二、返回控制语法为：return;作用: 结束函数执行，返回调用函数，而且把undefined作为函数的结果在大多数情况下,为事件处理函数返回false,可以防止默认的事件行为.例如,默认情况下点击一个<a>元素,页面会跳转到该元素href属性
MySQL 的 char 与 varchar bylijinnan mysql
今天发现，create table 时，MySQL 4.1有时会把 char 自动转换成 varchar 测试举例： CREATE TABLE `varcharLessThan4` ( `lastName` varchar(3) ) ; mysql> desc varcharLessThan4; +----------+---------+------+-
Quartz——TriggerListener和JobListener eksliang TriggerListener JobListener quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208624 一.概述 listener是一个监听器对象，用于监听scheduler中发生的事件，然后执行相应的操作；你可能已经猜到了，TriggerListeners接受与trigger相关的事件，JobListeners接受与jobs相关的事件。二.JobListener监听器 j
oracle层次查询 18289753290 oracle；层次查询；树查询
.oracle层次查询(connect by) oracle的emp表中包含了一列mgr指出谁是雇员的经理，由于经理也是雇员，所以经理的信息也存储在emp表中。这样emp表就是一个自引用表，表中的mgr列是一个自引用列，它指向emp表中的empno列，mgr表示一个员工的管理者， select empno,mgr,ename,sal from e
通过反射把map中的属性赋值到实体类bean对象中酷的飞上天空 javaee 泛型类型转换
使用过struts2后感觉最方便的就是这个框架能自动把表单的参数赋值到action里面的对象中但现在主要使用Spring框架的MVC，虽然也有@ModelAttribute可以使用但是明显感觉不方便。好吧，那就自己再造一个轮子吧。原理都知道，就是利用反射进行字段的赋值，下面贴代码主要类如下： import java.lang.reflect.Field; imp
SAP HANA数据存储：传统硬盘的瓶颈问题蓝儿唯美 HANA
SAPHANA平台有各种各样的应用场景，这也意味着客户的实施方法有许多种选择，关键是如何挑选最适合他们需求的实施方案。在《Implementing SAP HANA》这本书中，介绍了SAP平台在现实场景中的运作原理，并给出了实施建议和成功案例供参考。本系列文章节选自《Implementing SAP HANA》，介绍了行存储和列存储的各自特点，以及SAP HANA的数据存储方式如何提升空间压
Java Socket 多线程实现文件传输随便小屋 java socket
高级操作系统作业，让用Socket实现文件传输，有些代码也是在网上找的，写的不好，如果大家能用就用上。客户端类： package edu.logic.client; import java.io.BufferedInputStream; import java.io.Buffered
java初学者路径 aijuans java
学习Java有没有什么捷径?要想学好Java，首先要知道Java的大致分类。自从Sun推出Java以来，就力图使之无所不包，所以Java发展到现在，按应用来分主要分为三大块：J2SE,J2ME和J2EE,这也就是Sun ONE(Open Net Environment)体系。J2SE就是Java2的标准版，主要用于桌面应用软件的编程；J2ME主要应用于嵌入是系统开发，如手机和PDA的编程；J2EE
APP推广 aoyouzi APP 推广
一，免费篇 1，APP推荐类网站自主推荐最美应用、酷安网、DEMO8、木蚂蚁发现频道等,如果产品独特新颖，还能获取最美应用的评测推荐。PS：推荐简单。只要产品有趣好玩，用户会自主分享传播。例如足迹APP在最美应用推荐一次，几天用户暴增将服务器击垮。 2，各大应用商店首发合作老实盯着排期，多给应用市场官方负责人献殷勤。 3，论坛贴吧推广百度知道，百度贴吧，猫扑论坛，天涯社区，豆瓣（
JSP转发与重定向百合不是茶 jsp servlet Java Web jsp转发
在servlet和jsp中我们经常需要请求,这时就需要用到转发和重定向; 转发包括;forward和include 例子;forwrad转发; 将请求装法给reg.html页面关键代码; req.getRequestDispatcher("reg.html
web.xml之jsp-config bijian1013 java web.xml servlet jsp-config
1.作用：主要用于设定JSP页面的相关配置。 2.常见定义： <jsp-config> <taglib> <taglib-uri>URI(定义TLD文件的URI,JSP页面的tablib命令可以经由此URI获取到TLD文件)</tablib-uri> <taglib-location> TLD文件所在的位置
JSF2.2 ViewScoped Using CDI sunjing CDI JSF 2.2 ViewScoped
JSF 2.0 introduced annotation @ViewScoped; A bean annotated with this scope maintained its state as long as the user stays on the same view(reloads or navigation - no intervening views). One problem w
【分布式数据一致性二】Zookeeper数据读写一致性 bit1129 zookeeper
很多文档说Zookeeper是强一致性保证，事实不然。关于一致性模型请参考http://bit1129.iteye.com/blog/2155336 Zookeeper的数据同步协议 Zookeeper采用称为Quorum Based Protocol的数据同步协议。假如Zookeeper集群有N台Zookeeper服务器(N通常取奇数，3台能够满足数据可靠性同时
Java开发笔记白糖_ java开发
1、Map<key,value>的remove方法只能识别相同类型的key值 Map<Integer,String> map = new HashMap<Integer,String>(); map.put(1,"a"); map.put(2,"b"); map.put(3,"c"
图片黑色阴影 bozch 图片
.event{ padding:0; width:460px; min-width: 460px; border:0px solid #e4e4e4; height: 350px; min-heig
编程之美-饮料供货-动态规划 bylijinnan 动态规划
import java.util.Arrays; import java.util.Random; public class BeverageSupply { /** * 编程之美饮料供货 * 设Opt（V’，i）表示从i到n-1种饮料中，总容量为V’的方案中，满意度之和的最大值。 * 那么递归式就应该是：Opt（V’，i）=max{ k * Hi+Op
ajax大参数（大数据）提交性能分析 chenbowen00 Web Ajax 框架浏览器 prototype
近期在项目中发现如下一个问题项目中有个提交现场事件的功能，该功能主要是在web客户端保存现场数据（主要有截屏，终端日志等信息）然后提交到服务器上方便我们分析定位问题。客户在使用该功能的过程中反应点击提交后反应很慢，大概要等10到20秒的时间浏览器才能操作，期间页面不响应事件。根据客户描述分析了下的代码流程，很简单，主要通过OCX控件截屏，在将前端的日志等文件使用OCX控件打包，在将之转换为
[宇宙与天文]在太空采矿,在太空建造 comsci
我们在太空进行工业活动...但是不太可能把太空工业产品又运回到地面上进行加工,而一般是在哪里开采,就在哪里加工,太空的微重力环境,可能会使我们的工业产品的制造尺度非常巨大.... 地球上制造的最大工业机器是超级油轮和航空母舰,再大些就会遇到困难了,但是在空间船坞中,制造的最大工业机器,可能就没
ORACLE中CONSTRAINT的四对属性 daizj oracle CONSTRAINT
ORACLE中CONSTRAINT的四对属性 summary:在data migrate时,某些表的约束总是困扰着我们,让我们的migratet举步维艰,如何利用约束本身的属性来处理这些问题呢?本文详细介绍了约束的四对属性: Deferrable/not deferrable, Deferred/immediate, enalbe/disable, validate/novalidate,以及如
Gradle入门教程 dengkane gradle
一、寻找gradle的历程一开始的时候，我们只有一个工程，所有要用到的jar包都放到工程目录下面，时间长了，工程越来越大，使用到的jar包也越来越多，难以理解jar之间的依赖关系。再后来我们把旧的工程拆分到不同的工程里，靠ide来管理工程之间的依赖关系，各工程下的jar包依赖是杂乱的。一段时间后，我们发现用ide来管理项程很不方便，比如不方便脱离ide自动构建，于是我们写自己的ant脚本。再后
C语言简单循环示例 dcj3sjt126com c
# include <stdio.h> int main(void) { int i; int count = 0; int sum = 0; float avg; for (i=1; i<=100; i++) { if (i%2==0) { count++; sum += i; } } avg
presentModalViewController 的动画效果 dcj3sjt126com controller
系统自带(四种效果)： presentModalViewController模态的动画效果设置： [cpp] view plain copy UIViewController *detailViewController = [[UIViewController al
java 二分查找 shuizhaosi888 二分查找 java二分查找
需求：在排好顺序的一串数字中，找到数字T 一般解法：从左到右扫描数据，其运行花费线性时间O(N)。然而这个算法并没有用到该表已经排序的事实。 /** * * @param array * 顺序数组 * @param t * 要查找对象 * @return */ public stati
Spring Security（07）——缓存UserDetails 234390216 ehcache 缓存 Spring Security
Spring Security提供了一个实现了可以缓存UserDetails的UserDetailsService实现类，CachingUserDetailsService。该类的构造接收一个用于真正加载UserDetails的UserDetailsService实现类。当需要加载UserDetails时，其首先会从缓存中获取，如果缓存中没
Dozer 深层次复制 jayluns VO maven po
最近在做项目上遇到了一些小问题，因为架构在做设计的时候web前段展示用到了vo层，而在后台进行与数据库层操作的时候用到的是Po层。这样在业务层返回vo到控制层，每一次都需要从po-->转化到vo层，用到BeanUtils.copyProperties(source, target)只能复制简单的属性，因为实体类都配置了hibernate那些关联关系，所以它满足不了现在的需求，但后发现还有个很
CSS规范整理（摘自懒人图库） a409435341 html UI css 浏览器
刚没事闲着在网上瞎逛，找了一篇CSS规范整理，粗略看了一下后还蛮有一定的道理，并自问是否有这样的规范，这也是初入前端开发的人一个很好的规范吧。一、文件规范 1、文件均归档至约定的目录中。具体要求通过豆瓣的CSS规范进行讲解：所有的CSS分为两大类：通用类和业务类。通用的CSS文件，放在如下目录中：基本样式库 /css/core
C++动态链接库创建与使用你不认识的休道人 C++dll
一、创建动态链接库 1.新建工程test中选择”MFC [dll]”dll类型选择第二项"Regular DLL With MFC shared linked"，完成 2.在test.h中添加 extern “C” 返回类型 _declspec(dllexport)函数名(参数列表); 3.在test.cpp中最后写 extern “C” 返回类型 _decls
Android代码混淆之ProGuard rensanning ProGuard
Android应用的Java代码，通过反编译apk文件（dex2jar、apktool）很容易得到源代码，所以在release版本的apk中一定要混淆一下一些关键的Java源码。 ProGuard是一个开源的Java代码混淆器（obfuscation）。ADT r8开始它被默认集成到了Android SDK中。官网： http://proguard.sourceforge.net/
程序员在编程中遇到的奇葩弱智问题 tomcat_oracle jquery 编程 ide
　　现在收集一下：　　排名不分先后，按照发言顺序来的。 1、Jquery插件一个通用函数一直报错，尤其是很明显是存在的函数，很有可能就是你没有引入jquery。。。或者版本不对 2、调试半天没变化：不在同一个文件中调试。这个很可怕，我们很多时候会备份好几个项目，改完发现改错了。有个群友说的好：在汤匙
解决maven-dependency-plugin (goals "copy-dependencies","unpack") is not supported xp9802 dependency
解决办法：在plugins之前添加如下pluginManagement，二者前后顺序如下： [html] view plain copy <build> <pluginManagement

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他