鹅毛在路上了

Deep Learning With Pytorch - 数据预处理，以导入LUNA16数据集为例

文章目录

- 数据集简介
- - 什么是CT扫描？
  - 导入大型数据集并不是一份轻松的工作
- 在Jupyter Notebook中导入LUNA16数据集
- - 导入可能用到的第三方库：
  - LUNA16存放路径：
  - 用 pandas 读取 candidates.csv；
  - 读取 annotations.csv
  - 导入subset0和subset1的.mhd
  - 剔除路径、后缀名
  - 创建字典diameter_dict：
  - 创建candidateInfo_list:
  - 打印一张CT扫描数据
  - 数据类型转换，将IRC转为XYZ
  - 从CT扫描中取出⼀个结节
  - 定义getCandidateInfoList
- 封装成类的完整程序：

数据集简介

该数据集来源于LUNA16挑战赛，该数据集包括来自 LIDC/IDRI 数据集的不同格式的CT扫描图像以及附加注释。

The publicly available LIDC/IDRI database. This data uses the Creative Commons Attribution 3.0 Unported License. We excluded scans with a slice thickness greater than 2.5 mm. In total, 888 CT scans are included. The LIDC/IDRI database also contains annotations which were collected during a two-phase annotation process using 4 experienced radiologists. Each radiologist marked lesions they identified as non-nodule, nodule < 3 mm, and nodules >= 3 mm. See this publication for the details of the annotation process. The reference standard of our challenge consists of all nodules >= 3 mm accepted by at least 3 out of 4 radiologists. Annotations that are not included in the reference standard (non-nodules, nodules < 3 mm, and nodules annotated by only 1 or 2 radiologists) are referred to as irrelevant findings. The list of irrelevant findings is provided inside the evaluation script (annotations_excluded.csv).

下载地址

我们的CT数据来⾃2个文件：⼀个.mhd⽂件包含元数据头信息，另⼀个.raw文件包含组成三维数组的原始数据。我们所讨论的CT扫描的每个⽂件的名称都以⼀个称为系列UID的唯⼀标识符开始，该名称
依据医学中的数字成像和通信（DICOM）命名法。例如，对于uid1.2.3系列，有2个文件——1.2.3.mhd和1.2.3.raw.

图中的 (I,R,C) 代表（索引，行，列），之后我们会介绍相应的功能函数实现 (X,Y,Z) 和 (I,R,C) 之间的相互转换。

什么是CT扫描？

CT扫描本质上是三维X射线，以单通道数据（灰度）的三维数组表示，也就是一组堆叠的灰度PNG图像:

CT扫描(Computed Tomography)，即计算机断层扫描，实际上利用特殊仪器测量的放射性密度（成像原理参考Radon变换/逆变换），它具备检查材料的质量密度和原子序数的功能。就我们的目的而言，这种区别无关紧要，因为无论输入的确切单位是什么，模型都将使用并从CT数据中学习。

这种三维显示还允许我们通过隐藏我们不感兴趣的组织类型来查看物体内部。例如，我们可以以三维方式呈现数据，并将可见性限制为仅骨骼和肺组织：

导入大型数据集并不是一份轻松的工作

对于很多初学者来说，接触到的数据集如果是一组.csv或.xls，那么在Python中通过pandas就可以很方便地读入工程中查看，之后就是选取特征数和batch_size来作为模型输入了。而对于一些大型的数据集而言，尤其是随着数据的维度上升，从一维的时间序列到二维、多channels的图像数据，再到高维度的视频信号，这时的数据预处理并不是轻松几行代码就能完成的工作。

以下是根据一段Pytorch官方给出的数据导入范例，记录的学习笔记，在没有读过Deep Learning With Pytorch这本书的前提下，原本简单易懂的文章，本文会使读者看了觉得更懵逼，所以还是建议先阅读原书9-11章，github上有完整工程；
官方代码非常精简实用，对python中常见的数据结构，以及np.array，tensor等数据的读取、转换操作十分流畅，很适合作为学习资料。

在Jupyter Notebook中导入LUNA16数据集

导入可能用到的第三方库：

import copy
import csv
import functools
import glob
import os
import SimpleITK as sitk
import numpy as np
import pandas as pd
import collections
from collections import namedtuple

LUNA16存放路径：

可以自定义路径方便读取，我的是放在：

path = 'D:/papers/dataset/LUNA16/'

用 pandas 读取 candidates.csv；

candidates.csv⽂件中的LUNA标注包含了CT序列、候选结节的位置，以及⼀个标识（指示该候选者是否真的是结节）

df = pd.read_csv(path+'candidates.csv')
df.head()

读取 annotations.csv

annotations.csv⽂件包含⼀些已标注为实际结节的候选者的信息，我们对diameter_mm（结节直径）列所代表的信息特别感兴趣。

annotations = pd.read_csv(path+'annotations.csv')
annotations.head()

导入subset0和subset1的.mhd

我们的CT数据来⾃2个⽂件：⼀个.mhd⽂件包含元数据头信息，另⼀个.raw⽂件包含组成三维数组的原始数据。
LUNA16中有 subset0-subset4 约35G的CT扫描影像数据（完整的数据集包含subset0~9约200多G的数据），本文仅选取了subset0和subset1；
我们所讨论的CT扫描的每个⽂件的名称都以⼀个称为系列UID的唯⼀标识符开始，该名称依据医学中的数字成像和通信（DICOM）命名法。例如，对于uid1.2.3系列，有2个⽂件——1.2.3.mhd和1.2.3.raw

mhd_list = glob.glob(path+'subset*/*.mhd')

功能解析：
glob.glob 接受一个字符串参数，该参数可以包含通配符字符（例如 * 和 ?）以及路径分隔符，然后它会在指定的路径中搜索与模式匹配的文件路径，并将匹配的文件路径返回为一个列表。

以下是一个示例，演示了如何使用 glob.glob 来匹配某个目录下的所有 .txt 文件：

import glob

txt_files = glob.glob('/path/to/directory/*.txt')
print(txt_files)

剔除路径、后缀名

从名为mhd_list的列表中，针对每个文件路径，提取文件名的部分（去掉扩展名），然后将这些部分组成一个集合presentOnDisk_set：

presentOnDisk_set = {os.path.split(p)[-1][:-4] for p in mhd_list}

功能解析：

os.path.split(mhd_list[0]),os.path.split(mhd_list[0])[1],os.path.split(mhd_list[0])[1][:-4]

打印结果：

(('D:/papers/dataset/LUNA16\\subset0',
  '1.3.6.1.4.1.14519.5.2.1.6279.6001.105756658031515062000744821260.mhd'),
 '1.3.6.1.4.1.14519.5.2.1.6279.6001.105756658031515062000744821260.mhd',
 '1.3.6.1.4.1.14519.5.2.1.6279.6001.105756658031515062000744821260')

创建字典diameter_dict：

diameter_dict = {}
with open(path+'annotations.csv', "r") as f:
    for row in list(csv.reader(f))[1:]:
        series_uid = row[0]
        annotationCenter_xyz = tuple([float(x) for x in row[1:4]])
        annotationDiameter_mm = float(row[4])

        diameter_dict.setdefault(series_uid, []).append(
            (annotationCenter_xyz, annotationDiameter_mm)
        )

功能解析：

把完整的每个 row 都打印出来看一下，发现就是一组组 List，所以 row[0] 就代表了第一列的 series_uid，row[1:4] 分别是位置坐标和 diameter ：

创建candidateInfo_list:

与diameter_dict类似，candidateInfo_list从candidates.csv中获取series_uid，center_xyz坐标信息，并存放在一个Tuple里，最终分类嵌入candidateInfo_list；

requireOnDisk_bool = True

CandidateInfoTuple = namedtuple(
	'CandidateInfoTuple',
	'isNodule_bool, diameter_mm, series_uid, center_xyz',
)

candidateInfo_list = []
with open(path+'candidates.csv', "r") as f:
    for row in list(csv.reader(f))[1:]:  # 从第二行开始，第一行[0]是标题跳过
        series_uid = row[0]

        if series_uid not in presentOnDisk_set and requireOnDisk_bool:
            continue

        isNodule_bool = bool(int(row[4]))
        candidateCenter_xyz = tuple([float(x) for x in row[1:4]])

        candidateDiameter_mm = 0.0
        for annotation_tup in diameter_dict.get(series_uid, []):
            annotationCenter_xyz, annotationDiameter_mm = annotation_tup
            for i in range(3):
                delta_mm = abs(candidateCenter_xyz[i] - annotationCenter_xyz[i])
                if delta_mm > annotationDiameter_mm / 4:
                    break
            else:
                candidateDiameter_mm = annotationDiameter_mm
                break

        candidateInfo_list.append(CandidateInfoTuple(
            isNodule_bool,
            candidateDiameter_mm,
            series_uid,
            candidateCenter_xyz,
        ))

功能解析：通常在python中用idx表示行，用row表示列，而在matlab中row代表行，column代表列。

import csv

with open('your_csv_file.csv', 'r') as f:
    csv_reader = csv.reader(f)
    
    for idx, row in enumerate(csv_reader):
        if 2 <= idx <= 6:  # 读取第3到第7行的数据
            data = row[1]  # 第二列的数据
            # 在这里处理 data，它是第二列的数据
            
        if idx > 6:  # 已读取完第7行，结束循环
            break

这段代码表示读入csv数据的第3-7行，第2列的所有数据。

打印一张CT扫描数据

series_uid = '1.3.6.1.4.1.14519.5.2.1.6279.6001.100684836163890911914061745866'
mhd_path = glob.glob(
    path+'subset*/{}.mhd'.format(series_uid)
)[0]

ct_mhd = sitk.ReadImage(mhd_path)
ct_a = np.array(sitk.GetArrayFromImage(ct_mhd), dtype=np.float32)

ct_a.shape 为：(171, 512, 512)，代表（I,R,C），即每张CT的截面图都是512x512的，series_uid = '1.3.6.1.4.1.14519.5.2.1.6279.6001.100684836163890911914061745866’中包含171张截面图。

我们可以尝试打印其中几张CT扫描截面图：

import matplotlib.pyplot as plt

# 显示CT图像
plt.imshow(ct_a[0], cmap='gray')  # 显示第一个切片
plt.axis('off')  # 关闭坐标轴
plt.title('CT Scan Image')
plt.show()

ct_a[10]：

ct_a[50]：

ct_a[170]：

数据类型转换，将IRC转为XYZ

import util  # 调用pytorch范例中自带的另一个.py
util.irc2xyz

ct_a.clip(-1000, 1000, ct_a)  # 将像素值限制在 -1000 到 1000 的范围内

series_uid = series_uid
hu_a = ct_a   # 在做CT检查时,Hu是反映人体各组织的密度的指标

IrcTuple = collections.namedtuple('IrcTuple',['index', 'row', 'col'])
XyzTuple = collections.namedtuple('XyzTuple',['x', 'y', 'z'])
origin_xyz = XyzTuple(*ct_mhd.GetOrigin())
vxSize_xyz = XyzTuple(*ct_mhd.GetSpacing())
direction_a = np.array(ct_mhd.GetDirection()).reshape(3, 3)

从CT扫描中取出⼀个结节

xyz2irc和irc2xyz在util.py中能找到源码；

def getRawCandidate(center_xyz, width_irc):
    center_irc = util.xyz2irc( 
        center_xyz,
        origin_xyz,
        vxSize_xyz,
        direction_a,
    )

    slice_list = []
    for axis, center_val in enumerate(center_irc):
        start_ndx = int(round(center_val - width_irc[axis]/2))
        end_ndx = int(start_ndx + width_irc[axis])

        assert center_val >= 0 and center_val < hu_a.shape[axis], repr([series_uid, center_xyz, origin_xyz, vxSize_xyz, center_irc, axis])

        if start_ndx < 0:
            # log.warning("Crop outside of CT array: {} {}, center:{} shape:{} width:{}".format(
            #     series_uid, center_xyz, center_irc, hu_a.shape, width_irc))
            start_ndx = 0
            end_ndx = int(width_irc[axis])

        if end_ndx > hu_a.shape[axis]:
            # log.warning("Crop outside of CT array: {} {}, center:{} shape:{} width:{}".format(
            #     series_uid, center_xyz, center_irc, hu_a.shape, width_irc))
            end_ndx = hu_a.shape[axis]
            start_ndx = int(hu_a.shape[axis] - width_irc[axis])

        slice_list.append(slice(start_ndx, end_ndx))

    ct_chunk = hu_a[tuple(slice_list)]

    return ct_chunk, center_irc

a = getRawCandidate((-30,-30,-60),(10,10,10))

a[0].shape == (10,10,10)，即 ct_chunk；
a[1] == IrcTuple(index=162, row=507, col=200)，即 xyz2irc 后的 center_irc；

定义getCandidateInfoList

函数中设置了一些数据清洗的规则：

对于给定series_uid的每个候选条⽬，我们循环遍历之前为同⼀个series_uid收集的标注，看看2个坐标是否⾜够接近，如果⾜够接近则可以认为它们是相同的结节。如果是同⼀个结节，那太好了！现在我们有了这个结节的直径信息。如果没有找到匹配的结节，也没有关系，我们把结节的直径设置为0.

def getCandidateInfoList(requireOnDisk_bool=True):
    # 构建一个存放当前所有uid的集合
    mhd_list = glob.glob(path+'subset*/*.mhd')
    presentOnDisk_set = {os.path.split(p)[-1][:-4] for p in mhd_list}

    diameter_dict = {}
    with open(path+'annotations.csv', "r") as f:
        for row in list(csv.reader(f))[1:]:
            series_uid = row[0]
            annotationCenter_xyz = tuple([float(x) for x in row[1:4]])
            annotationDiameter_mm = float(row[4])

            diameter_dict.setdefault(series_uid, []).append(
                (annotationCenter_xyz, annotationDiameter_mm)
            )

    candidateInfo_list = []
    with open(path+'candidates.csv', "r") as f:
        for row in list(csv.reader(f))[1:]:
            series_uid = row[0]

            if series_uid not in presentOnDisk_set and requireOnDisk_bool:
                continue

            isNodule_bool = bool(int(row[4]))
            candidateCenter_xyz = tuple([float(x) for x in row[1:4]])

            candidateDiameter_mm = 0.0
            for annotation_tup in diameter_dict.get(series_uid, []):
                annotationCenter_xyz, annotationDiameter_mm = annotation_tup
                for i in range(3):
                    delta_mm = abs(candidateCenter_xyz[i] - annotationCenter_xyz[i])
                    if delta_mm > annotationDiameter_mm / 4:
			# 将直径除以2得到半径，将半径除以2以要求2个结节中⼼点相对结节⼤⼩的距离不要太远。这将导致
			# 边界框检查，⽽不是真正的距离检查
                        break
                else:
                    candidateDiameter_mm = annotationDiameter_mm
                    break

            candidateInfo_list.append(CandidateInfoTuple(
                isNodule_bool,
                candidateDiameter_mm,
                series_uid,
                candidateCenter_xyz,
            ))

    candidateInfo_list.sort(reverse=True)
    return candidateInfo_list

封装成类的完整程序：

前几步是将下列的class Ct拆成各部分单独解析，现在写成完整的一个类，导入LUNA16数据：

import torch
from torch.utils.data import Dataset
from logconf import logging
from util import XyzTuple, xyz2irc

log = logging.getLogger(__name__)

class Ct:
    def __init__(self, series_uid):
        mhd_path = glob.glob(
            path+'subset*/{}.mhd'.format(series_uid)
        )[0]

        ct_mhd = sitk.ReadImage(mhd_path)
        ct_a = np.array(sitk.GetArrayFromImage(ct_mhd), dtype=np.float32)

        # 在做CT检查时,Hu是反映人体各组织的密度的指标
        ct_a.clip(-1000, 1000, ct_a)  # Hu的正常值为-1000~+1000

        self.series_uid = series_uid
        self.hu_a = ct_a

        self.origin_xyz = XyzTuple(*ct_mhd.GetOrigin())
        self.vxSize_xyz = XyzTuple(*ct_mhd.GetSpacing())
        self.direction_a = np.array(ct_mhd.GetDirection()).reshape(3, 3)

    def getRawCandidate(self, center_xyz, width_irc):
        center_irc = xyz2irc(
            center_xyz,
            self.origin_xyz,
            self.vxSize_xyz,
            self.direction_a,
        )

        slice_list = []
        for axis, center_val in enumerate(center_irc):
            start_ndx = int(round(center_val - width_irc[axis]/2))
            end_ndx = int(start_ndx + width_irc[axis])

            assert center_val >= 0 and center_val < self.hu_a.shape[axis], repr([self.series_uid, center_xyz, self.origin_xyz, self.vxSize_xyz, center_irc, axis])

            if start_ndx < 0:
                # log.warning("Crop outside of CT array: {} {}, center:{} shape:{} width:{}".format(
                #     self.series_uid, center_xyz, center_irc, self.hu_a.shape, width_irc))
                start_ndx = 0
                end_ndx = int(width_irc[axis])

            if end_ndx > self.hu_a.shape[axis]:
                # log.warning("Crop outside of CT array: {} {}, center:{} shape:{} width:{}".format(
                #     self.series_uid, center_xyz, center_irc, self.hu_a.shape, width_irc))
                end_ndx = self.hu_a.shape[axis]
                start_ndx = int(self.hu_a.shape[axis] - width_irc[axis])

            slice_list.append(slice(start_ndx, end_ndx))

        ct_chunk = self.hu_a[tuple(slice_list)]

        return ct_chunk, center_irc


# @functools.lru_cache(1, typed=True) #存入缓存，以免重复加载数据
def getCt(series_uid):
    return Ct(series_uid)

# @raw_cache.memoize(typed=True)
def getCtRawCandidate(series_uid, center_xyz, width_irc):
    ct = getCt(series_uid)
    ct_chunk, center_irc = ct.getRawCandidate(center_xyz, width_irc)
    return ct_chunk, center_irc

我们在这里通过指定每⼀组第10个样本作为验证集的成员来实现这⼀点，由val_stride参数指定；
我们还将接收一个isValSet_bool参数，并使用它来确定是否应该只保留训练数据、验证数据还是保留所有数据：

class LunaDataset(Dataset):
    def __init__(self,
                 val_stride=0,
                 isValSet_bool=None,
                 series_uid=None,
            ):
        self.candidateInfo_list = copy.copy(getCandidateInfoList())
		# 复制返回值，这样缓存的副本就不会因为修改self.candidateInfo_list⽽受到影响
		
        if series_uid:
            self.candidateInfo_list = [
                x for x in self.candidateInfo_list if x.series_uid == series_uid
            ]

        if isValSet_bool:
            assert val_stride > 0, val_stride
            self.candidateInfo_list = self.candidateInfo_list[::val_stride]
            assert self.candidateInfo_list
        elif val_stride > 0:
            del self.candidateInfo_list[::val_stride]
            assert self.candidateInfo_list

        log.info("{!r}: {} {} samples".format(
            self,
            len(self.candidateInfo_list),
            "validation" if isValSet_bool else "training",
        ))

    def __len__(self):
        return len(self.candidateInfo_list)

    def __getitem__(self, ndx):
        candidateInfo_tup = self.candidateInfo_list[ndx]
        width_irc = (32, 48, 48)

        candidate_a, center_irc = getCtRawCandidate(
            candidateInfo_tup.series_uid,
            candidateInfo_tup.center_xyz,
            width_irc,
        )

        candidate_t = torch.from_numpy(candidate_a)
        candidate_t = candidate_t.to(torch.float32)
        candidate_t = candidate_t.unsqueeze(0)  # 将单通道的数据转换为多通道的数据，以满足某些模型的输入要求

		# pos_t输出yes/no变成onehot型, [0,1]代表是结节，[1,0]代表不是结节
        pos_t = torch.tensor([
                not candidateInfo_tup.isNodule_bool,  # 不是结节
                candidateInfo_tup.isNodule_bool       # 是结节
            ],
            dtype=torch.long,  # 变成长整型
        )

        return (
            candidate_t,
            pos_t,
            candidateInfo_tup.series_uid,
            torch.tensor(center_irc),
        )

试打印 LunaDataset()[0] ：分别返回输出
candidate_t,
pos_t,
candidateInfo_tup.series_uid,
torch.tensor(center_irc),

(tensor([[[[-732., -810., -863.,  ..., -848., -865., -890.],
           [-767., -826., -855.,  ..., -908., -896., -879.],
           [-807., -859., -848.,  ..., -898., -903., -897.],
           ...,
           [-874., -869., -839.,  ..., -159., -121., -104.],
           [-923., -930., -911.,  ..., -115., -104., -117.],
           [-898., -898., -901.,  ...,  -89.,  -93., -129.]],
 
          [[-776., -779., -860.,  ..., -852., -875., -874.],
           [-839., -834., -889.,  ..., -875., -894., -898.],
           [-861., -857., -882.,  ..., -838., -865., -889.],
           ...,
           [-862., -932., -917.,  ..., -111.,  -94., -101.],
           [-896., -918., -898.,  ...,  -16.,    1.,  -41.],
           [-875., -894., -881.,  ...,  -55.,  -47.,  -83.]],
 
          [[-854., -898., -884.,  ..., -886., -878., -857.],
           [-856., -876., -865.,  ..., -869., -880., -884.],
           [-841., -859., -881.,  ..., -857., -844., -832.],
           ...,
           [-744., -880., -873.,  ...,  -95.,  -55.,  -40.],
           [-858., -895., -870.,  ...,  -57.,    4.,    4.],
           [-892., -897., -888.,  ...,  -54.,  -23.,  -22.]],
 
          ...,
 
          [[-901., -885., -877.,  ...,  -11.,    5.,   20.],
           [-909., -883., -881.,  ...,  -14.,   -3.,   29.],
           [-925., -911., -895.,  ...,  -35.,   -1.,   31.],
           ...,
           [ 373.,  436.,  473.,  ...,   17.,   29.,   26.],
           [ 413.,  439.,  458.,  ...,  -39.,  -20.,  -11.],
           [ 334.,  296.,  302.,  ...,    7.,   20.,   36.]],
 
          [[-911., -909., -894.,  ...,  -16.,  -16.,   11.],
           [-935., -920., -903.,  ...,   12.,    6.,   20.],
           [-936., -919., -886.,  ...,    6.,   26.,   33.],
           ...,
           [   0.,   37.,   49.,  ...,   26.,   41.,   32.],
           [  60.,   36.,   51.,  ...,   -4.,   -6.,   -9.],
           [ 213.,  153.,  114.,  ...,  -31.,  -12.,    1.]],
 
          [[-949., -950., -956.,  ...,   11.,   12.,   23.],
           [-948., -950., -941.,  ...,   -6.,   -6.,   16.],
           [-924., -923., -904.,  ...,  -40.,  -47.,   -9.],
           ...,
           [ -77.,  -85.,  -98.,  ...,   48.,   72.,   73.],
           [ -81., -112., -106.,  ...,   50.,   72.,   85.],
           [ -55.,  -47.,  -56.,  ...,   86.,   96.,   96.]]]]),
 tensor([0, 1]),
 '1.3.6.1.4.1.14519.5.2.1.6279.6001.287966244644280690737019247886',
 tensor([ 91, 360, 341]))

其中LunaDataset()[0][0].shape 为 torch.Size([1, 32, 48, 48])，1代表unsqueeze()添加的1维。

TDengine服务器端启动失败问题（客户端连接失败问题）深度视觉机器 Ubuntu20 TDengine3.x tdengine linux 服务器
第一次问题：服务端状态信息：客户端连接失败：在服务端找问题，在/var/log/taos/taosdlog.0查看日志发现问题：端口号已被占用！于是通过psaux|greptao查看进程发现确实被占用了。通过kill-9进程号杀死进程重新systemctlstarttaosd启动即可！此时在客户端连接成功。
仅用10张图片，AI就能学会识别万物？多模态小样本学习颠覆传统！沃恩智慧人工智能深度学习人工智能学习深度学习
小样本学习与多模态结合是当前人工智能领域的热门研究方向，旨在通过结合多模态数据（如视觉、语言、音频等）来提高模型在数据稀缺情况下的学习效率和性能。例如，ZS-DeconvNet方法在Nature上发表，展示了其在极低训练数据需求下，将图像分辨率提升超过1.5倍衍射极限的能力。此外，CPE-CLIP和MMFL等方法通过利用预训练模型和冻结的大规模视觉语言模型，实现了跨会话的迁移学习和快速适应新样本。
发文新思路！双通道CNN的惊人突破，准确率接近100%！沃恩智慧深度学习人工智能 cnn 人工智能神经网络
双通道CNN作为一种创新的卷积神经网络架构，正引领深度学习领域的新趋势。其核心优势在于并行卷积层设计，能够同时处理更多特征信息，从而显著提升模型的特征表示能力和识别精度。这种架构不仅提高了计算效率，还有效降低了过拟合风险，使其在复杂视觉任务中表现卓越。例如，最新的研究提出了一种名为DDTransUNet的混合网络，结合了Transformer和CNN的优势，通过双分支编码器和双重注意力机制，有效解
UMLS初探愉悦的麻婆豆腐人工智能健康医疗
什么是UMLSUMLS（UnifiedMedicalLanguageSystem，统一医学语言系统），简单来说就是将不同的医学标准统一到一套体系的系统，主要为了医疗系统的统一而构建出的。UMLS的主要组成部分Metathesaurus：一个包含多个医学术语系统的元数据库，旨在统一和映射不同来源的医学概念。SemanticNetwork：一个包含语义分类和关系的网络。它可以帮助用户识别概念之间的语义
git,bash - 例子整理 LostSpeed git bash git bash
文章目录git,bash-例子整理概述笔记遍历目录，找到目标文件后干活备份一个文件html_url_clear.shENDgit,bash-例子整理概述在gitbash中的脚本和linuxbash中好像差不多。整理一些例子，为以后做参考笔记遍历目录，找到目标文件后干活#!/bin/bash#gitbash脚本-遍历修改当前目录下得所有.gitmodules,替换https库url到ssh库url#
AI大模型DeepSeek本地部署及使用 zy_xingdian 行癫k8s教程行癫Go教程行癫ArgoCD系列人工智能 Deepseek AI 行癫 xingdian 云计算 ollama
AI大模型DeepSeek本地部署及使用作者：行癫（盗版必究）一：认识DeepSeek1.什么是DeepSeekDeepSeek中文名深度求索，杭州深度求索人工智能基础技术研究有限公司对外开源，性能对齐OpenAI-o1正式版。二：认识Ollama1.什么是OllamaOllama是一个开源的LLM（大型语言模型）服务工具&#
什么是python uv，如何在windows上安装uv，基础的用法有哪些？几道之旅 python uv windows
什么是PythonUV？UV是由Astral公司（Rust工具Ruff的开发者）推出的高性能Python包管理工具，基于Rust编写，旨在替代传统的pip和pip-tools。其核心优势在于极快的速度（比pip快10-100倍）、轻量级设计（仅几十MB）以及现代化的依赖管理（支持pyproject.toml和uv.lock文件）。UV集成了虚拟环境管理、Python版本控制、依赖解析等功能，目标是
【开发工具】开发一个类postman的idea插件问道飞鱼开发工具知识 postman intellij-idea lua
类postman的idea插件开发开发过程1.环境准备2.创建插件项目3.项目结构4.编写`plugin.xml`5.创建ToolWindow6.设计UI7.处理HTTP请求8.构建和运行插件9.测试插件10.打包和发布总结相关文献开发过程开发一个类似Postman的IntelliJIDEA插件涉及多个步骤，包括插件项目初始化、UI设计、HTTP请求处理、响应展示等。以下是一个简化的开发过程和代码
【deepseek】论文笔记--DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning 大表哥汽车人人工智能大语言模型学习笔记论文阅读人工智能 deepseek
DeepSeek-R1论文解析1.论文基本信息标题：DeepSeek-R1:IncentivizingReasoningCapabilityinLLMsviaReinforcementLearning作者：DeepSeek-AI团队（联系邮箱：research@deepseek.com）发表时间与出处：2024年，AIME2024（人工智能与数学教育国际会议）关键词：ReinforcementLe
汽车行业汽车召回数据爬虫：抓取汽车召回数据，分析产品质量和安全问题西攻城狮北汽车爬虫安全 python 实战案例
目录一、搭建开发环境1.依赖库安装2.配置虚拟环境（可选）二、目标网站分析1.网页结构分析2.动态内容识别三、编写爬虫代码1.从静态页面抓取数据1.1获取页面内容1.2解析HTML1.3完整示例2.抓取动态加载内容2.1配置Selenium和ChromeDriver2.2模拟浏览器抓取3.处理分页四、数据清洗与存储1.数据清洗2.数据存储五、数据分析与可视化1.数据分析2.数据可视化六、项目优化1
AI赋能前端开发：团队协作的全新模式梦游人人工智能前端
近年来，人工智能（AI）技术飞速发展，深刻地改变着软件开发的模式，特别是前端开发领域。在快速迭代的互联网时代，高效的团队协作对前端项目的成功至关重要。然而，传统的前端开发团队协作常常面临沟通成本高、效率低、代码风格不一致等诸多挑战。本文将探讨如何利用AI写代码工具，例如ScriptEcho，来显著提升前端开发团队的协作效率，优化开发流程，开启团队协作的全新模式。……AI时代的前端开发团队协作：效率
基于华为自研NPU Ascend 910的TensorFlow 1.x训练脚本迁移和使能混合精度记录 Tianyi Li 1997 华为云 tensorflow 华为人工智能深度学习 python
简介基于TesorFlow1.x以Sess.run形式搭建入门级——手写数字分类网络，并迁移到华为自研NPUAscend910，同时使能混合精度。硬件介绍华为自研NPUAscend910，即昇腾910AI处理器（简称NPU），根据官方介绍，是在2019年发布的人工智能（AI）专用的神经网络处理器，其算力高达256T，最新款算力高达310T，是业界主流芯片算力的2倍。当前业界大多数训练脚本基于Ten
清华大学DeepSeek资料爆火：一场技术、舆论与时代情绪的共振 deepseek
文末有惊喜哟！近期，清华大学与深度求索公司（DeepSeek）联合发布的智能模型DeepSeek-R1技术资料在国内互联网引发热议。从科技媒体到社交平台，从专业开发者到普通网民，"DeepSeek"一词持续占据热搜榜单。这场看似突如其来的爆火，实质上是技术突破、社会情绪与传播机制共同作用的结果。其背后折射出的，既是中国人工智能领域发展的新里程碑，也是公众对科技自主创新的深层期待。一、技术突破：中国
Dledger部署RocketMQ高可用集群（9节点集群） Java程序员廖志伟 rocketmq
文章目录博主介绍本文内容9节点集群高可用集群规划集群准备工作runserver.shrunbroker.sh设置目录归属组与用户与容器的配置一致安装jdk节点0配置（ip地址为192.168.80.101的机器）broker-n0.confbroker-n1.confbroker-n2.confdocker-compose.yaml节点1配置（ip地址为192.168.80.102的机器）brok
AI赋能前端开发：重塑工作环境，拥抱高效未来 botar 人工智能前端
随着人工智能技术的飞速发展，各行各业都经历着深刻的变革。前端开发领域也不例外，AI写代码工具的兴起正以前所未有的速度重塑着我们的工作方式，带来更高的效率和更灵活的工作环境。本文将深入探讨AI如何改变前端开发的工作环境，并以ScriptEcho为例，展示AI赋能前端开发的实践案例。……过去，前端开发常常被繁琐的代码编写和重复性工作所束缚。开发者需要花费大量时间处理样板代码、调试错误，以及进行大量的重
开源ERP系统odoo的安装与配置 catmes 开源 ERP python postgresql OpenERP
开源ERP系统odoo的安装与配置安装下载源码安装PostgreSQL安装Python3下载odoo依赖配置启动安装安装方式有两种:分发包安装:https://www.odoo.com/documentation/16.0/administration/install/packages.html源码安装:https://www.odoo.com/documentation/16.0/adminis
2月第五讲：深度剖析 Python 编程中的数据处理与机器学习应用 2501_90442144 python 机器学习开发语言
一、引言在当今数字化时代，编程已经成为推动各个领域发展的关键力量。Python作为一种高级编程语言，以其简洁、易读、功能强大等特点，在数据处理、机器学习、人工智能等众多领域得到了广泛的应用。本文将深入探讨Python在数据处理和机器学习方面的应用，通过实际案例展示其强大的功能和灵活性，帮助读者更好地理解和掌握Python编程在这些领域的应用技巧。二、Python基础概述2.1Python的特点与优
AI赋能前端性能优化：效率与体验的完美平衡 2401_89760565 需求分析人工智能前端
在当今快节奏的互联网世界中，用户体验至关重要。一个加载缓慢、反应迟钝的网站或应用，很容易导致用户流失。而前端性能优化，作为提升用户体验的关键环节，却常常面临着诸多挑战。复杂的代码逻辑、庞大的资源文件、以及难以捉摸的性能瓶颈，都让前端开发者倍感压力。幸运的是，人工智能（AI）技术的兴起为我们提供了解决这些问题的全新途径，特别是AI代码生成器的出现，为前端性能优化带来了革命性的变革。……AI辅助前端性
AI代码生成器如何提升前端开发效率及工作满意度 2401_89757965 人工智能前端
近年来，人工智能技术飞速发展，深刻地改变着各个行业，前端开发领域也不例外。越来越多的开发者开始使用AI写代码工具，借助AI的力量提升开发效率，优化工作流程。本文将探讨AI工具如何通过提升前端开发效率来影响开发者的工作满意度，并展望未来发展趋势。……AI赋能前端开发：效率提升与工作满意度传统的前端开发工作中，开发者常常被繁琐的重复性工作所困扰。例如，编写大量的组件代码，反复调整页面布局，处理各种浏览
在DeepSeek面前，还需要学习.NET吗？ dotNET跨平台学习
随着人工智能技术的快速发展，像DeepSeek这样的大模型不断涌现，给技术领域带来了新的变革和挑战。与此同时，.NET作为微软推出的成熟技术平台，也有着自己独特的地位和价值。那么在DeepSeek面前，是否还需要学习.NET呢？答案是肯定的，原因主要有以下几点：应用场景不同-DeepSeek：主要聚焦于自然语言处理、智能对话等人工智能领域，为用户提供智能问答、文本生成等服务。例如，用户可以通过De
rpx与px换算璞~ 微信小程序前端 javascript html
前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站rpx单位是微信小程序中css的尺寸单位，rpx可以根据屏幕宽度进行自适应。规定屏幕宽为750rpx。如在iPhone6上，屏幕宽度为375px，共有750个物理像素，则750rpx=375px=750物理像素，1rpx=0.5px设备rpx换算px(屏幕宽度/750)px换算rpx(750/屏幕宽度)
［每日动态］科技新闻每日信息差2025年2月14日我的青春不太冷科技
###2025年2月14日科技新闻每日信息差####引言在快速发展的科技领域，信息差是决定个人和企业竞争力的关键因素。2025年2月14日，全球科技界迎来了多项重要进展，从人工智能到量子计算，从医疗科技到太空探索，这些动态不仅塑造了未来的技术格局，也为普通人提供了新的机遇。####人工智能与计算智能国际会议（AICI2025）AICI2025于今日开幕，聚焦类脑计算和多模态大模型的前沿研究。会议吸
爬虫自动化之drissionpage实现随时切换代理ip 十一姐 python爬虫逆向案例中高级爬虫自动化代理
目录一、视频二、dp首次启动设置代理三、dp利用插件随时切换代理一、视频视频直接点击学习SwitchyOmega插件使用其它二、dp首次启动设置代理fromDrissionPageimportChromiumPage,ChromiumOptionsfromloguruimportloggerco
pythonweb项目实例-Python Web项目实战Day05 - 编写Web框架 weixin_39593427
在正式开始Web开发前，我们需要编写一个Web框架。aiohttp已经是一个Web框架了，为什么我们还需要自己封装一个？原因是从使用者的角度来说，aiohttp相对比较底层，编写一个URL的处理函数需要这么几步：第一步，编写一个用@asyncio.coroutine装饰的函数：@asyncio.coroutinedefhandle_url_xxx(request):pass第二步，传入的参数需要自
PyTorch Lightning LightningDataModule 介绍 qq_27390023 pytorch 人工智能 python
LightningDataModule是PyTorchLightning提供的数据模块，用于统一管理数据加载流程（包括数据准备、预处理、拆分、批量加载等）。它的核心作用是将数据处理逻辑与模型解耦，提高代码的可复用性和可读性。1.LightningDataModule的作用✅封装数据预处理：数据下载、清理、转换等步骤都可以在LightningDataModule中完成。✅统一数据加载流程：确保训练、
【笔记】使用 Pytorch 进行分布式训练 LittleNyima 人工智能深度学习 pytorch 分布式
本文原文以CCBY-NC-SA4.0许可协议发布于技术相关｜使用Pytorch进行分布式训练，转载请注明出处。其实Pytorch分布式训练已经不算什么新技术了，之所以专门写一篇blog是因为今天训模型的时候出现了一个没见过的问题，在调试的时候发现自己平时都是用别人写好的分布式代码，没有深入研究过其中的实现细节，因此感觉有必要整理吸收一下。最简单的数据并行作为最简单的并行计算方式，使用nn.Data
实验随记2-Pytorch Lightning多机多卡训练晓岚和雪实验随记 pytorch 人工智能 python 深度学习分布式
本文章主要收录笔者在阅读时发现的一些比较优质的多机多卡训练教程~~，由于pytorchLightning多机多卡示例很少，因此需要等笔者最近做完实验验证后才能更新示例。不断完善中…~~及多机多卡训练细节。任务需求：实现多机多卡训练，模型可能继承torch.nn或者torch.lightning。示例实现5节点4GPU共计20卡训练。使用pytorch_lightning==1.9.4存在bug:启
PyTorch Lightning多GPU分布式日志介绍 qq_27390023 pytorch 人工智能 python
分布式日志是指在分布式系统中，多个节点（如多台机器或多个GPU）协同工作时，对系统运行状态、错误信息、性能指标等进行记录的过程。在多GPU/分布式训练环境下，多个进程会同时运行，普通的print()或logging可能会在所有GPU上重复输出，导致日志混乱。PyTorchLightning提供了一些分布式日志控制工具，确保日志仅在rank0进程打印，防止重复输出。lightning_utiliti
mysql sql脚本雪花算法梦空细雨 mysql sql 数据库
算法相关学习资料：https://edu.51cto.com/video/1451.html雪花算法在MySQLSQL脚本中的实现作为一名经验丰富的开发者，我将指导你如何实现MySQLSQL脚本中的雪花算法。雪花算法是一种生成唯一ID的算法，广泛应用于分布式系统中。雪花算法流程首先，我们通过一个表格来展示雪花算法的实现流程：步骤描述1创建雪花算法表2插入初始数据3生成唯一ID4使用唯一ID雪花算法
Python 协程检测Kubernetes服务端口 shykevin
Python协程检测Kubernetes服务端口一、需求分析在上一篇文章，链接如下：https://www.cnblogs.com/xiao987334176/p/10237551.html已经得到了需要的数据，现在需要对这些端口做检测，判断端口是否正常！实际情况是，有上百个端口需要检测。如果一个个检测，可能需要花费几分钟的时间，效率不够快！那么首先想到的就是多进程，但是一个进程会消耗一个CPU。
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &