阿甘教你AI大数据

机器学习聚类分析——k-means文本聚类分析

最近比较喜欢听《认真的老去》这首歌，那就抓这个豆瓣评论做数据集吧，，做个评论的聚类分析。

一、抓到数据

机器学习聚类分析——k-means文本聚类分析_第1张图片

抓出来140条评论~~

放代码~~

import requests

from bs4 import BeautifulSoup

start_page = 1

end_page = 7

data = []

while start_page <= end_page:

html = BeautifulSoup(requests.get(url='https://music.douban.com/subject/26979930/comments/hot?p='.format(start_page)).text)

data += [content.text for content in html.find_all('span',{'class':'short'})]

start_page +=1

下面开始我们的聚类分析

文本通过jieba分词，

传递给CountVectorizer,统计出词频。

再传递给TfidfTransformer，统计出tf-idf值，

对tf-idf进行聚类计算。

放代码

机器学习聚类分析——k-means文本聚类分析_第2张图片

from sklearn.feature_extraction.text import CountVectorizer,TfidfTransformer

from sklearn.cluster import KMeans

import jieba

vectorizer = CountVectorizer()

X = vectorizer.fit_transform([" ".join([b for b in jieba.cut(a)]) for a in data])

tfid = TfidfTransformer()

X = tfid.fit_transform(X.toarray())

那么我们聚合几类呢？

机器学习聚类分析——k-means文本聚类分析_第3张图片

from sklearn import metrics

def easy_get_parameter_k_means(data):

test_score = []

n_clusters_end = 50

n_clusters_start = 2

while n_clusters_start <= n_clusters_end:

km = KMeans(n_clusters=n_clusters_start)

km.fit(data)

clusters = km.labels_.tolist()

score = metrics.silhouette_score(X=X,labels=clusters)

num = sorted([(np.sum([1 for a in clusters if a==i]),i) for i in set(clusters)])[-1]

test_score.append([n_clusters_start,score,num[0],num[1]])

n_clusters_start += 1

return pd.DataFrame(test_score,columns=['共分了几类','分数','最大类包含的个数','聚类的名称']).sort_values(by ='分数',ascending =False)

easy_get_parameter_k_means(X.toarray()) #得到最佳参数

算出应该分几类

机器学习聚类分析——k-means文本聚类分析_第4张图片

这里用到了“轮廓系数”算法，用户计算聚类的分数。聚类的好不好。

机器学习聚类分析——k-means文本聚类分析_第5张图片

综合考虑，分成11个簇是最佳的聚类效果，带入参数。

最后看分类结果：

机器学习聚类分析——k-means文本聚类分析_第6张图片

机器学习聚类分析——k-means文本聚类分析_第7张图片

似乎，还不错噢~

原创（AI_大数据)文章，公众号首发，欢迎您的关注

机器学习聚类分析——k-means文本聚类分析_第8张图片

打赏作者（下图），未来写出更好的文章及教程

机器学习聚类分析——k-means文本聚类分析_第9张图片

你可能感兴趣的:(机器学习聚类分析——k-means文本聚类分析)

构建知识图谱：从文本到结构化数据的转化 sagvWSRJHMNEB 知识图谱人工智能 python
技术背景介绍知识图谱是一种将信息表示为实体及其相互关系的结构化数据模型，广泛用于提高数据检索和决策支持的质量。特别是在基于知识的检索增强生成（RAG）应用中，通过将非结构化文本转化为知识图谱，可以显著提升系统对复杂关系的理解和导航能力。核心原理解析构建知识图谱的核心步骤包括：信息提取和数据库存储。从文本中提取结构化信息主要依赖于大语言模型（LLM），如OpenAI的GPT-4，其能力在于解析和分类
AAAI2024论文解读|Towards Fairer Centroids in k-means Clustering面向更公平的 k 均值聚类中心 paixiaoxin 文献阅读论文合集支持向量机机器学习人工智能聚类公平性 k 均值聚类质心代表性群体代表性公平性
论文标题TowardsFairerCentroidsink-meansClustering面向更公平的k均值聚类中心论文链接TowardsFairerCentroidsink-meansClustering论文下载论文作者StanleySimoes,DeepakP,MuirisMacCarthaigh内容简介本文提出了一种新的聚类级质心公平性（Cluster-levelCentroidFairne
vue mvvm 原理 LikY03321 vue.js 学习前端
一.什么是mvvmMVVM是Model-View-ViewModel的简写。它本质上就是MVC的改进版。MVVM就是将其中的View的状态和行为抽象化，让我们将视图UI和业务逻辑分开。要实现一个mvvm的库，我们首先要理解清楚其实现的整体思路。先看看下图的流程：1.实现compile,进行模板的编译，包括编译元素（指令）、编译文本等，达到初始化视图的目的，并且还需要绑定好更新函数；2.实现Obse
R语言的正则表达式编程小筑包罗万象 golang 开发语言后端
R语言中的正则表达式：深度解析与应用引言正则表达式（RegularExpression），简称正则，是一种用于描述字符串模式的工具。在数据科学、文本处理以及数据清理中，正则表达式都是一项不可或缺的技能。而R语言作为一种广泛应用于统计分析和数据科学的编程语言，内置了对正则表达式的强大支持。本文将深入探讨R语言中的正则表达式，包括基本语法、常用函数，以及在实际数据处理中如何应用正则表达式。正则表达式的
使用AI API生成生动比喻句的实践指南 wd48564awd 人工智能 python
技术背景介绍在日常交流和表达中，比喻句能够使文字更生动、更具感染力。与其费力地构思，不如利用AIAPI来快速生成生动的比喻句。在这篇文章中，我们将探讨如何使用AIAPI来生成形象的比喻句。核心原理解析AI文本生成技术，尤其是基于大型语言模型的API，如Anthropic的Claude或OpenAI的GPT，以其理解和生成自然语言文本的能力，能够根据输入提示生成富有创意和感染力的比喻句。这是通过学习
[使用Claude API构建回文检查应用的指南] qwe54165a4wd easyui 前端 javascript python
技术背景介绍AnthropicAPI提供了对Claude的访问功能，Claude是一个强大的语言模型，能够回答各种文本相关的问题。通过该API，我们可以开发应用程序，比如让Claude帮助我们实现一个检查字符串是否为回文的Python函数。核心原理解析回文是指正读和反读都相同的字符串。通过ClaudeAPI，我们可以让Claude生成用于检查回文的Python代码。AnthropicAPI的最大优
什么是HTTP POST请求？初学者指南与示范 lingllllove http 网络协议网络
什么是HTTPPOST请求？HTTP（超文本传输协议）是Web的基础协议，用于在客户端（如浏览器）和服务器之间传输数据。HTTP请求方法有多种，最常见的包括GET和POST。本文将详细介绍HTTPPOST请求，包括其用途、工作原理及示范。HTTPPOST请求的用途POST请求用于向服务器发送数据，通常用于以下场景：提交表单：例如用户注册或登录表单。上传文件：例如图片或文档上传。发送数据：例如向服务
AIGC视频生成国产之光：ByteDance的PixelDance模型好评笔记 AIGC-视频补档 AIGC 计算机视觉人工智能深度学习机器学习论文阅读面试
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文详细介绍ByteDance的视频生成模型PixelDance，论文于2023年11月发布，模型上线于2024年9月，同时期上线的模型还有Seaweed（论文未发布）。优质专栏回顾：机器学习笔记深度学习笔记多模态论文笔记AIGC—图像文章目录论文摘要引言输入训练和推理时的数据处理总结相关工作视频生成长视频生成方法模型架构
解锁C#中Regex.Replace的高阶玩法 myshare2022 c#
一、引言在C#的编程世界里，字符串处理是一项极为常见且重要的任务。而Regex.Replace作为C#中强大的字符串处理工具，如同一位技艺精湛的工匠，能够按照我们设定的规则，对字符串进行精准的修改和调整。它不仅能实现简单的查找与替换，还在处理复杂文本模式时展现出卓越的能力。在文本解析、数据清洗、格式转换等众多场景中，Regex.Replace都发挥着不可替代的作用。接下来，就让我们一同深入探索Re
使用AI工具链的实战指南 azzxcvhj 人工智能 python
在这篇指南中，我们将深入探讨如何创建调用工具的链(Chains)和智能体(Agents)。工具可以是API、函数、数据库等等，它们能让模型的能力超越简单的文本或消息输出。使用模型与工具的关键在于如何正确地提示模型选择合适的工具并提供正确的输入。技术背景介绍在现代AI应用中，模型本身虽然强大，但通常需要结合其他工具来实现更复杂的功能。通过集成工具，我们可以扩展模型的能力，轻松实现如计算、数据查询和特
使用LangChain构建信息提取链 azzxcvhj langchain python 深度学习
在现代文本处理应用中，从非结构化文本中提取结构化信息是一个重要且常见的任务。本教程将向您展示如何使用LangChain构建一个信息提取链。技术背景介绍随着大型语言模型(LLMs)的出现，它们的生成能力被广泛应用于各种信息提取任务。通过定义结构化的提取需求，我们可以利用这些模型从复杂的文本中获取所需的信息。核心原理解析提取链的核心在于定义清晰的提取需求，即通过Schema(数据模型)来告诉模型我们需
Linux(Centos 7.6)命令详解：file 豆是浪个 linux centos 运维
1.命令作用查看文件类型(DeterminetypeofFILEs)其他说明：Windows系统是通过文件扩展名来定义文件类型；Linux可通过file命令分析文件头部信息中的标识信息来显示文件类型，通过file一系列测试来确认文件是文本文件、目录、链接、二进制、压缩文件等。2.命令语法Usage:file[OPTION...][FILE...]Usage:file[选项...][文件...]3.
C++重要类型：string类不是吧啊喂 C++c++开发语言蓝桥杯
目录前言一、头文件二、定义与赋值1、定义一个空的string对象。2、用一个字符串常量初始化string对象。3、通过复制另一个string对象来初始化。三、访问字符四、内置函数前言在C++中，string类是标准库的一部分，用于处理字符串。它提供了一种更方便、更安全的方式来操作文本数据，相比于C风格的字符串（以char*和一组相关的函数来处理）有很多优势。一、头文件在使用string作为变量类型
Linux(Centos 7.6)命令详解：iconv 豆是浪个 linux centos 运维
1.命令作用将给定文件的编码从一种编码转换为另一种编码(Convertencodingofgivenfilesfromoneencodingtoanother)2.命令语法Usage:iconv[OPTION...][FILE...]3.参数详解OPTION:输入/输出格式规范:-f,--from-code=NAME，原始文本编码-t,--to-code=NAME，输出文件编码(目标文件编码)信息
python转转商超书籍信息爬虫 Python数据分析与机器学习爬虫 python 网络爬虫爬虫
1基本理论1.1概念体系网络爬虫又称网络蜘蛛、网络蚂蚁、网络机器人等，可以按照我们设置的规则自动化爬取网络上的信息，这些规则被称为爬虫算法。是一种自动化程序，用于从互联网上抓取数据。爬虫通过模拟浏览器的行为，访问网页并提取信息。这些信息可以是结构化的数据（如表格数据），也可以是非结构化的文本。爬虫任务的执行流程通常包括发送HTTP请求、解析HTML文档、提取所需数据等步骤。1.2技术体系1请求库:
Spring AI - 对话模型还是转转 spring 人工智能 java
目录：SpringAI框架介绍SpringAI对话模型核心API简介SpringAI提供了很多便利的功能，主要如下：AIModelAPI“ModelAPI”提供了聊天、文本转图像、音频转录、文本转语音、嵌入等功能，且不局限于某个固定的大模型提供商，如OpenAI，Microsoft，Amazon,Google,AmazonBedrock,HuggungFace等等。下面是支持的AI模型的示意图：C
Python气象数据分析：风速预报订正、台风预报数据智能订正、机器学习预测风电场的风功率、浅水模型、预测ENSO等小艳加油大气科学 python 人工智能气象机器学习
目录专题一Python和科学计算基础专题二机器学习和深度学习基础理论和实操专题三气象领域中的机器学习应用实例专题四气象领域中的深度学习应用实例更多应用Python是功能强大、免费、开源，实现面向对象的编程语言，在数据处理、科学计算、数学建模、数据挖掘和数据可视化方面具备优异的性能，这些优势使得Python在气象、海洋、地理、气候、水文和生态等地学领域的科研和工程项目中得到广泛应用。可以预见未来Py
YOLOv8/YOLOv11使用web界面推理自己的模型，Gradio框架快速搭建挂科边缘 YOLOv8改进 YOLO 前端计算机视觉目标检测人工智能 python
前言Gradio是一个开源Python库，用于快速构建和共享机器学习模型的Web界面。开发者可以通过简单的Python代码将机器学习模型封装成交互式应用，无需复杂的设置即可在浏览器中使用自己训练好模型。接下来教你使用Gradio框架构建一个简单Web界面推理YOLOv8/YOLOv11模型。话不多说上检测结果：一、YOLOv8/YOLOv11源码下载YOLOv8源码下载：官网打不开的话，从我的网盘
python input 文件路径_python基础 — 文件操作童雅洋梨 python input 文件路径
读取键盘输入Python提供了两个内置函数从标准输入读入一行文本，默认的标准输入是键盘。如下：raw_inputinputraw_input函数raw_input([prompt])函数从标准输入读取一个行，并返回一个字符串(去掉结尾的换行符)。input函数input([prompt])函数和raw_input([prompt])函数基本类似，但是input可以接收一个Python表达式作为输入
深度学习笔记——模型部署好评笔记深度学习笔记深度学习笔记人工智能 transformer 模型部署大模型部署大模型
大家好，这里是好评笔记，公主号：Goodnote，专栏文章私信限时Free。本文简要概括模型部署的知识点，包括步骤和部署方式。文章目录模型部署模型部署的关键步骤常见的模型部署方式优势与挑战总结边缘端部署方案总结历史文章机器学习深度学习模型部署模型部署是指将训练好的机器学习或深度学习模型集成到生产环境中，使其能够在实际应用中处理实时数据和提供预测服务。模型部署的流程涉及模型的封装、部署环境的选择、部
探索泰坦尼克号生存分类数据集：机器学习与数据分析的完美起点岑童嵘
探索泰坦尼克号生存分类数据集：机器学习与数据分析的完美起点【下载地址】泰坦尼克号生存分类数据集本仓库提供了一个经典的机器学习数据集——泰坦尼克号生存分类数据集。该数据集包含两个CSV文件：训练集和测试集。数据集主要用于训练和评估机器学习模型，以预测泰坦尼克号乘客的生存情况项目地址:https://gitcode.com/open-source-toolkit/35561项目介绍泰坦尼克号生存分类数
基于Python机器学习、深度学习技术提升气象、海洋、水文领域实践应用 KY_chenzhao python 机器学习深度学习气象
1.背景与目标ENSO（ElNiño-SouthernOscillation）是全球气候系统中最显著的年际变率现象之一，对全球气候、农业、渔业等有着深远的影响。准确预测ENSO事件的发生和发展对于减灾防灾具有重要意义。近年来，深度学习技术在气象领域得到了广泛应用，其中长短期记忆网络（LSTM）因其在处理时间序列数据方面的优势，被广泛用于ENSO预测。2.数据准备数据来源包括NOAA（美国国家海洋和
R语言的软件工程 BinaryBardC 包罗万象 golang 开发语言后端
R语言的软件工程1.引言随着数据科学的快速发展，R语言作为一种统计计算和图形绘制的编程语言，其在数据分析、可视化以及机器学习等领域的应用日益广泛。尽管R语言在数据处理上有其独特的优势，但要将其运用于大型项目和商业应用中，就需要遵循软件工程的原则。本篇文章将探讨R语言在软件工程中的应用，主要涵盖软件开发生命周期、代码规范、版本控制、测试和文档等方面。2.软件开发生命周期软件开发生命周期（SDLC）是
Python中的Pipeline快速教学、 Coding Is Fun python 开发语言
在Python中，Pipeline通常指的是机器学习工作流中的流水线，尤其是在使用scikit-learn库时。Pipeline允许你将多个数据处理步骤和模型训练步骤串联起来，形成一个有序的工作流程。这不仅使代码更简洁，还能确保在训练和预测时一致的数据处理。以下是一个快速教学，帮助你掌握Python中Pipeline的核心概念和使用方法。目录安装和导入必要的库Pipeline的基本概念创建一个简单
Python 操作二进制文件昱晏 Python 1024程序员节 python
在计算机中，文件可以分为两种类型：文本文件和二进制文件。文本文件包含人类可读的字符，而二进制文件包含计算机指令或数据，无法直接阅读。常见的二进制文件包括图片、音频、视频、可执行文件等。Python提供了处理二进制文件的工具，允许你读写任意类型的数据。1以二进制模式打开文件在Python中，操作二进制文件时，需要使用'b'作为文件模式的一部分。常见的二进制文件模式有：'rb'：以二进制读取文件。'w
Python input 怎么使用彭彭不吃虫子 windows 数据库服务器
一、input()函数简介Python的input()函数是一个内置函数，用于从用户接收输入。当程序运行到input()函数时，会暂停并等待用户输入一些文本，用户输入的文本将作为函数的返回值。这使得我们可以在程序中获取用户的输入，以便根据输入执行相应的操作。二、input()函数语法input()函数的基本语法如下：input(prompt=None)其中，prompt参数是可选的，它表示在等待用
实现一个简单的学生成绩管理系统巷955 开发语言 python
要求：（1）创建一个文本文件students.txt，其中每一行包含一个学生的名字和成绩，用逗号分隔。示例内容如下：Alice,85Bob,90Charlie,78（2）编写一个程序，读取students.txt文件，计算所有学生的平均成绩，并将结果写入一个新文件average.txt。（3）在average.txt文件中输出如下内容：Theaveragescoreofthestudentsis:
Python mysql数据库连接池戴** Python
最近在写一个Python的文本分析,需要大量的读取数据库(千万级别mysql)并进行更新操作,运行着程序发现一个问题,过了一会儿程序就报错说链接已经满了,或者是端口不可重复使用,因此我在网上找到了一个连接池的代码用于解决这个问题,在此处贴出代码本身是有配置文件的,因为我觉得在我的项目中不必要所以就删除了#!/usr/bin/envpython#-*-coding:utf-8-*-importpym
使用Anthropic API的入门指南 dqw41111d microsoft python
使用AnthropicAPI的入门指南在现代AI应用中，API提供了一种强大的方式来访问复杂的AI服务。Anthropic提供了一组强大的API来执行各种AI任务。本文将带您深入了解如何使用AnthropicAPI进行AI应用开发。技术背景介绍AnthropicAPI允许开发者以简单的HTTP请求模式与AI模型进行交互，返回的结果可以被用于多种场景，如文本生成、情感分析等。通过API，开发者可以避
使用Claude构建文本生成应用 asd5646asd easyui 前端 javascript python
在现代AI技术领域，Claude以其在广泛的文本任务中的优越表现受到广泛关注。无论是处理代码、撰写散文还是其他自然语言任务，Claude都能提供精准的文本输出。为了更好地实现这些功能，我们需要掌握Claude的API使用，以及如何编写有效的提示词。本文将深入探讨Claude的文本生成能力，通过可运行的代码示例，帮助您快速上手实际开发。技术背景介绍Claude是由Anthropic开发的一种智能文本
ASM系列六利用TreeApi 添加和移除类成员 lijingyao8206 jvm 动态代理 ASM 字节码技术 TreeAPI
同生成的做法一样，添加和移除类成员只要去修改fields和methods中的元素即可。这里我们拿一个简单的类做例子，下面这个Task类，我们来移除isNeedRemove方法，并且添加一个int 类型的addedField属性。 package asm.core; /** * Created by yunshen.ljy on 2015/6/
Springmvc-权限设计 bee1314 spring Web jsp
万丈高楼平地起。权限管理对于管理系统而言已经是标配中的标配了吧，对于我等俗人更是不能免俗。同时就目前的项目状况而言，我们还不需要那么高大上的开源的解决方案，如Spring Security，Shiro。小伙伴一致决定我们还是从基本的功能迭代起来吧。目标： 1.实现权限的管理（CRUD） 2.实现部门管理（CRUD) 3.实现人员的管理（CRUD） 4.实现部门和权限
算法竞赛入门经典（第二版）第2章习题 CrazyMizzz c 算法
2.4.1 输出技巧 #include <stdio.h> int main() { int i, n; scanf("%d", &n); for (i = 1; i <= n; i++) printf("%d\n", i); return 0; } 习题2-2 水仙花数(daffodil
struts2中jsp自动跳转到Action 麦田的设计者 jsp webxml struts2 自动跳转
1、在struts2的开发中，经常需要用户点击网页后就直接跳转到一个Action，执行Action里面的方法，利用mvc分层思想执行相应操作在界面上得到动态数据。毕竟用户不可能在地址栏里输入一个Action（不是专业人士） 2、＜jsp:forward page="xxx.action" /＞，这个标签可以实现跳转，page的路径是相对地址,不同与jsp和j
php 操作webservice实例 IT独行者 PHP webservice
首先大家要简单了解了何谓webservice，接下来就做两个非常简单的例子，webservice还是逃不开server端与client端。我测试的环境为：apache2.2.11 php5.2.10做这个测试之前，要确认你的php配置文件中已经将soap扩展打开，即extension=php_soap.dll; OK 现在我们来体验webservice //server端 serve
Windows下使用Vagrant安装linux系统 _wy_ windows vagrant
准备工作：下载安装 VirtualBox ：https://www.virtualbox.org/ 下载安装 Vagrant ：http://www.vagrantup.com/ 下载需要使用的 box ：官方提供的范例：http://files.vagrantup.com/precise32.box 还可以在 http://www.vagrantbox.es/
更改linux的文件拥有者及用户组(chown和chgrp) 无量 c linux chgrp chown
本文（转） http://blog.163.com/yanenshun@126/blog/static/128388169201203011157308/ http://ydlmlh.iteye.com/blog/1435157 一、基本使用：使用chown命令可以修改文件或目录所属的用户：命令
linux下抓包工具矮蛋蛋 linux
原文地址： http://blog.chinaunix.net/uid-23670869-id-2610683.html tcpdump -nn -vv -X udp port 8888 上面命令是抓取udp包、端口为8888 netstat -tln 命令是用来查看linux的端口使用情况 13 . 列出所有的网络连接 lsof -i 14. 列出所有tcp 网络连接信息 l
我觉得mybatis是垃圾！：“每一个用mybatis的男纸，你伤不起” alafqq mybatis
最近看了每一个用mybatis的男纸，你伤不起原文地址：http://www.iteye.com/topic/1073938 发表一下个人看法。欢迎大神拍砖；个人一直使用的是Ibatis框架，公司对其进行过小小的改良；最近换了公司，要使用新的框架。听说mybatis不错；就对其进行了部分的研究；发现多了一个mapper层；个人感觉就是个dao；
解决java数据交换之谜百合不是茶数据交换
交换两个数字的方法有以下三种，其中第一种最常用 /* 输出最小的一个数 */ public class jiaohuan1 { public static void main(String[] args) { int a =4; int b = 3; if(a<b){ // 第一种交换方式 int tmep =
渐变显示 bijian1013 JavaScript
<style type="text/css"> #wxf { FILTER: progid:DXImageTransform.Microsoft.Gradient(GradientType=0, StartColorStr=#ffffff, EndColorStr=#97FF98); height: 25px; } </style>
探索JUnit4扩展：断言语法assertThat bijian1013 java 单元测试 assertThat
一.概述 JUnit 设计的目的就是有效地抓住编程人员写代码的意图，然后快速检查他们的代码是否与他们的意图相匹配。 JUnit 发展至今，版本不停的翻新，但是所有版本都一致致力于解决一个问题，那就是如何发现编程人员的代码意图，并且如何使得编程人员更加容易地表达他们的代码意图。JUnit 4.4 也是为了如何能够
【Gson三】Gson解析{"data":{"IM":["MSN","QQ","Gtalk"]}} bit1129 gson
如何把如下简单的JSON字符串反序列化为Java的POJO对象? {"data":{"IM":["MSN","QQ","Gtalk"]}} 下面的POJO类Model无法完成正确的解析： import com.google.gson.Gson;
【Kafka九】Kafka High Level API vs. Low Level API bit1129 kafka
1. Kafka提供了两种Consumer API High Level Consumer API Low Level Consumer API(Kafka诡异的称之为Simple Consumer API，实际上非常复杂) 在选用哪种Consumer API时，首先要弄清楚这两种API的工作原理，能做什么不能做什么，能做的话怎么做的以及用的时候，有哪些可能的问题
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-归并排序 bylijinnan java
import java.util.Arrays; public class MergeSort { public static void main(String[] args) { int[] a={20,1,3,8,5,9,4,25}; mergeSort(a,0,a.length-1); System.out.println(Arrays.to
Netty源码学习-CompositeChannelBuffer bylijinnan java netty
CompositeChannelBuffer体现了Netty的“Transparent Zero Copy” 查看API（ http://docs.jboss.org/netty/3.2/api/org/jboss/netty/buffer/package-summary.html#package_description）可以看到，所谓“Transparent Zero Copy”是通
Android中给Activity添加返回键 hotsunshine Activity
// this need android:minSdkVersion="11" getActionBar().setDisplayHomeAsUpEnabled(true); @Override public boolean onOptionsItemSelected(MenuItem item) {
静态页面传参 ctrain 静态
$(document).ready(function () { var request = { QueryString : function (val) { var uri = window.location.search; var re = new RegExp("" + val + "=([^&?]*)", &
Windows中查找某个目录下的所有文件中包含某个字符串的命令 daizj windows 查找某个目录下的所有文件包含某个字符串
findstr可以完成这个工作。 [html] view plain copy >findstr /s /i "string" *.* 上面的命令表示，当前目录以及当前目录的所有子目录下的所有文件中查找"string&qu
改善程序代码质量的一些技巧 dcj3sjt126com 编程 PHP 重构
有很多理由都能说明为什么我们应该写出清晰、可读性好的程序。最重要的一点，程序你只写一次，但以后会无数次的阅读。当你第二天回头来看你的代码时，你就要开始阅读它了。当你把代码拿给其他人看时，他必须阅读你的代码。因此，在编写时多花一点时间，你会在阅读它时节省大量的时间。让我们看一些基本的编程技巧：尽量保持方法简短尽管很多人都遵
SharedPreferences对数据的存储 dcj3sjt126com
SharedPreferences简介： &nbs
linux复习笔记之bash shell (2) bash基础 eksliang bash bash shell
转载请出自出处： http://eksliang.iteye.com/blog/2104329 1.影响显示结果的语系变量（locale） 1.1locale这个命令就是查看当前系统支持多少种语系，命令使用如下： [root@localhost shell]# locale LANG=en_US.UTF-8 LC_CTYPE="en_US.UTF-8"
Android零碎知识总结 gqdy365 android
1、CopyOnWriteArrayList add(E) 和remove(int index)都是对新的数组进行修改和新增。所以在多线程操作时不会出现java.util.ConcurrentModificationException错误。所以最后得出结论：CopyOnWriteArrayList适合使用在读操作远远大于写操作的场景里，比如缓存。发生修改时候做copy，新老版本分离，保证读的高
HoverTree.Model.ArticleSelect类的作用 hvt Web .net C#hovertree asp.net
ArticleSelect类在命名空间HoverTree.Model中可以认为是文章查询条件类，用于存放查询文章时的条件，例如HvtId就是文章的id。HvtIsShow就是文章的显示属性，当为-1是，该条件不产生作用，当为0时，查询不公开显示的文章，当为1时查询公开显示的文章。HvtIsHome则为是否在首页显示。HoverTree系统源码完全开放，开发环境为Visual Studio 2013
PHP 判断是否使用代理 PHP Proxy Detector 天梯梦 proxy
1. php 类 I found this class looking for something else actually but I remembered I needed some while ago something similar and I never found one. I'm sure it will help a lot of developers who try to
apache的math库中的回归——regression（翻译） lvdccyb Math apache
这个Math库，虽然不向weka那样专业的ML库，但是用户友好，易用。多元线性回归，协方差和相关性（皮尔逊和斯皮尔曼），分布测试（假设检验，t，卡方，G），统计。数学库中还包含，Cholesky，LU，SVD，QR，特征根分解，真不错。基本覆盖了：线代，统计，矩阵，最优化理论曲线拟合常微分方程遗传算法（GA），还有3维的运算。。。
基础数据结构和算法十三：Undirected Graphs (2) sunwinner Algorithm
Design pattern for graph processing. Since we consider a large number of graph-processing algorithms, our initial design goal is to decouple our implementations from the graph representation
云计算平台最重要的五项技术 sumapp 云计算云平台智城云
云计算平台最重要的五项技术 1、云服务器云服务器提供简单高效，处理能力可弹性伸缩的计算服务，支持国内领先的云计算技术和大规模分布存储技术，使您的系统更稳定、数据更安全、传输更快速、部署更灵活。特性机型丰富通过高性能服务器虚拟化为云服务器，提供丰富配置类型虚拟机，极大简化数据存储、数据库搭建、web服务器搭建等工作；仅需要几分钟，根据CP
《京东技术解密》有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的12月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 12月试读活动回顾： http://webmaster.iteye.com/blog/2164754 本次技术图书试读活动获奖名单及相应作品如下：一等奖（两名） Microhardest：http://microhardest.ite

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他