weishantc

python入门系列(3) -- python语言基础语法

本章主要根据 “python manual”(在安装python后附带)中的Tutorial简化整理而来。有时间可以查看官方原来的文档。遇到模块或函数不清楚的也可以查找Manual。

内置数据类型

和大多数动态语言一样，python中的变量是动态变量，所以定义时不需要指定变量类型，只跟实际赋值时有关(python的所有变量都是对象)。

numbers(数字)

数字的使用跟数学表达式一样

>>> (50-5*6)/4      # 数学表达式
5
>>> 7/3             # 默认返回floor
2
>>> 7/-3
-3
>>> 7/3.0           # 浮点数
2.3333333333333335

变量赋值

>>> width = 20
>>> x = y = z = 10  # 变量可以同时赋值
>>> x,y = 100,200   # 多个赋值
>>> print x, y
100 200

进制转换

>>> a=100
>>> hex(a)          # 十六进制
'0x64'
>>> oct(a)          # 八进制
'0144'

ascii码转换

>>> ord('a')        # 字母转数值
97
>>> chr(97)         # 数值转字母
'a'

string(字符串)

python通过单引号、双引号或三重引号引起来的表示字符串。在这里，使用单引号和双引号完全是一样的，使用单引号做引用，字串中可以双引号字符；使用双引号，字串中可以包含单引号，否则，需要加转义字符

>>> 'doesn\'t'
"doesn't"
>>> "doesn't"
"doesn't"
>>> '"Yes," he said.'
'"Yes," he said.'
>>> "\"Yes,\" he said."
'"Yes," he said.'
>>> '"Isn\'t," she said.'
'"Isn\'t," she said.'

跨行引用，则需要和用 \n 和 \ 连接字符

>>> print "Usage: thingy [OPTIONS]\n\
     -h                        Display this usage message\n\
     -H hostname               Hostname to connect to"
Usage: thingy [OPTIONS]
     -h                        Display this usage message
     -H hostname               Hostname to connect to

使用三重引号，""" 或 ''' ，可以更方便地跨行字串

>>> print """
Usage: thingy [OPTIONS]
     -h                        Display this usage message
     -H hostname               Hostname to connect to
"""
 Usage: thingy [OPTIONS]
     -h                        Display this usage message
     -H hostname               Hostname to connect to

原始字符串，通过在字符串前面加字母r，表示字串是raw string，不会对字串中的字符进行转义

>>> print r"""aaaaaaaa\nbbbb"""
aaaaaaaa\nbbbb

字符串可以通过+号进行连接，通过*号进行重复

>>> word = 'Help' + 'A'
>>> word
'HelpA'
>>> '<' + word*5 + '>'
''

字串采用和C的一样的索引方式，下标从0开始。同时，子串可以使用分片的记法，冒号左边为开始字符的下标，右边为结束字符下标+1

>>> word[4]
'A'
>>> word[0:2]
'He'
>>> word[2:4]
'lp'

分片记法还用两个方便的默认值，左边默认为0，右边默认为整个字符串长度

>>> word[:2]    # The first two characters
'He'
>>> word[2:]    # Everything except the first two characters
'lpA'

分片记法，还可以使用负数下标，表示

>>> word[-1]     # The last character
'A'
>>> word[-2]     # The last-but-one character
'p'
>>> word[-2:]    # The last two characters
'pA'
>>> word[:-2]    # Everything except the last two characters
'Hel'

取子字符串时，如果超过范围，会被自动截取

>>> word[-100:200]
'HelpA'

字符串还可以步进式地截取字符。如:

>>> word[::2]
'HlA

>>> word[::-1]   # 倒序输出
'ApleH'

上面主要介绍字符串的截取和拼接，字符串其他常用操作如下:

去左右空白字符或特殊字符

>>> "  aaaa   ".strip()          # 去左右空白字符
aaaa
>>> "  aaaa   ".rstrip()         # lstrip去左侧空格,rstrip去右侧空格
  aaaa   
>>> "  aaaa,,,...".rstrip(',.!') # 去指定字符   
'  aaaa'

取字符串长度

>>> len(word)
5

定位字符或子串

>>> "aaabbbccc".index('bb')
3
>>> "aaabbbccc".index('bc')
5

比较字符串

>>> cmp('aa','bb')
-1
>>> cmp('aa','aa')
0
>>> cmp('bb','aa')
1

字符串大小写转换

>>> 'aaa'.upper()
'AAA'
>>> 'Aaaa'.lower()
'aaaa'

字符串查找

>>> 'aaabbbccc'.find('bbb')
3

index如果没找到会抛出异常，find没找到返回-1

字符串替换

>>> "aaabbbaaadddd".replace('a', 'e')
'eeebbbeeedddd'
>>> "aaabbbaaadddd".replace('aaa', 'e')
'ebbbedddd'

字符串分割

>>> "aaaaa;;bbb;;ccc;ddd;".split(';;')
['aaaaa', 'bbb', 'ccc;ddd;']            # 字符串数组
>>> "aaaaa;bbb;ccc;ddd;".split(';')
['aaaaa', 'bbb', 'ccc', 'ddd', '']

合并字符串

>>> ''.join(['aaaa', 'bbb', 'ccc'])
'aaaabbbccc'
>>> ';'.join(['aaaa', 'bbb', 'ccc'])
'aaaa;bbb;ccc'

python的字符串是不可修改的。如修改一个字符，应使用replace，或使用左边字串+新字符+右边字串拼接而成

list(数组)

python使用如下语法定义list，list的元素类型可以不一样

>>> a = ['spam', 'eggs', 100, 1234]
>>> a
['spam', 'eggs', 100, 1234]

list访问的分片记法与字符串相似，而且一样使用+进行连接，* 进行重复

>>> a[1:-1]
['eggs', 100]
>>> a[:2] + ['bacon', 2*2]
['spam', 'eggs', 'bacon', 4]
>>> 3*a[:3] + ['Boo!']
['spam', 'eggs', 100, 'spam', 'eggs', 100, 'spam', 'eggs', 100, 'Boo!']

与字符串不同，python的list是可以修改的

>>> letters = ['a', 'b', 'c', 'd', 'e', 'f', 'g']
>>> # replace some values
>>> letters[2:5] = ['C', 'D', 'E']
>>> letters
['a', 'b', 'C', 'D', 'E', 'f', 'g']
>>> # now remove them
>>> letters[2:5] = []
>>> letters
['a', 'b', 'f', 'g']

返回list大小

>>> a = ['a', 'b', 'c', 'd']
>>> len(a)
4

list可以嵌套，构造多维数组

>>> p=['a', 'b']
>>> p2=['a', p, 'b']
>>> p2
['a', ['a', 'b'], 'b']

list其他常用操作:

append(x) 添加一个元素到末尾
extend(x) 相当于+
insert(i, x) 在i插入x
remove(x) 删除x
pop() 弹出
index(x) 返回第一个匹配x的下标
count(x) 返回匹配x的个数
sort(cmp=None, key=None, reverse=False) 排序
reverse() 生成反序数组

注意append和+的区别，append一个数组，是把数组当成一个元素添加进去，+数组是把所有元素添加进去

list还提供了一种叫做 list comprehensions 方法可以从一个list产生新的list，它参照了函数式编程中的filter-map-reduce的思想[参考第5章]

>>> l=range(10)                 
>>> l
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> [x**2 for x in l if x%2]        # 返回list中奇数的平方
[1, 9, 25, 49, 81]

tuple(元组)

tuple由多个值和逗号组成，前后可加括号，也可以不加

>>> t = 12345, 54321, 'hello!'
>>> t[0]
12345
>>> t
(12345, 54321, 'hello!')
>>> (a,b) = (2, 3)
>>> c,d = 1, (2, 3)
>>> len(d)
2

与list不同，tuple是不可修改的，所以不能修改tuple中的数据。tuple一般在赋值、打印或pack,unpack时使用。tuple打印的例子

>>> print "Hello, %s, %s, %s" % ('1', '2', '3')  #此时tuple需要加()否则语法错误

set(集合)

set是无序的，元素不重复的collection。主要用于成员检测和消除重复元素。集合可以由大括号、数组、字符串来生成。集合还支持并集、交集、差集等操作

>>> a={1, 2, 2, 2, 3}
>>> a
set([1, 2, 3])
>>> set(['1','2','2','3'])
set(['1', '3', '2'])
>>> 'orange' in fruit                 # fast membership testing
True
  >>> # Demonstrate set operations on unique letters from two words
...
>>> a = set('abracadabra')
>>> b = set('alacazam')
>>> a                                  # unique letters in a
set(['a', 'r', 'b', 'c', 'd'])
>>> a - b                              # letters in a but not in b
set(['r', 'd', 'b'])
>>> a | b                              # letters in either a or b
set(['a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'])
>>> a & b                              # letters in both a and b
set(['a', 'c'])
>>> a ^ b                              # letters in a or b but not both
set(['r', 'd', 'b', 'm', 'z', 'l'])

dictionary(字典)

dictionary是无序的，键值对集合

>>> tel = {'jack': 4098, 'sape': 4139}
>>> tel['guido'] = 4127
>>> tel
{'sape': 4139, 'guido': 4127, 'jack': 4098}
>>> tel['jack']
4098
>>> del tel['sape']             
>>> tel['irv'] = 4127
>>> tel
{'guido': 4127, 'irv': 4127, 'jack': 4098}
>>> tel.keys()
['guido', 'irv', 'jack']
>>> 'guido' in tel
True
 >>> dict([('sape', 4139), ('guido', 4127), ('jack', 4098)])
{'sape': 4139, 'jack': 4098, 'guido': 4127}

如果key是简单的字符串， dict也可以这样构造

>>> dict(sape=4139, guido=4127, jack=4098)
{'sape': 4139, 'jack': 4098, 'guido': 4127}

del操作可用于list, set, dictionary等可变的结构中，用于删除元素

其他类型

其他类型还有

None 空值
True 为真的布尔类型
False 为假的布尔类型
deque 队列，需要import collections
nametuple 命名tuple

表达式

python中的表达式有以下特点:

语句不需要以 ; 结束，不同的语句需要换行
语法块(if,while,for,defun,class等)不是通过加大括号来确定范围，而是用:加对代码对齐的方式来确定，python通过语法强制对齐的方式，让代码更可读，如下面if代码块的例子

>>> # 加:，程序块多条语句用tab或空格对齐
>>> if 1>2:
    print '1'
    print '2'
 >>> # 没对齐导致语法错误
>>> if 1>2:
    print '1'
      print '2'

  File "", line 3
    print '2'
    ^
IndentationError: unexpected indent

通过#号进行注释
空语句 pass

控制流

条件判断

条件判断语法很简单，if…elif…else，如下

>>> x = int(raw_input("Please enter an integer: "))
Please enter an integer: 42
 >>> if x < 0:
    print 'Negative'
elif x == 0:
    print 'Zero'
else:
    print 'Positive'
 Positive

条件除了比较，还可以是一些操作。in和not in用来判断元素是否在序列中(list,tuple,set,string,dictionary等), is和not is用来判断元素是否是相同的对象

>>> '1' in ['1', '2', '3']
True
>>> '1' in ('1','2','3')
True
>>> '1' in {'1','2','3'}
True
>>> '1' in {'1':1, '2':1}
True

对对象的判断，如果对象不是None类型的，就返回True

>>> if not None:
    print "It's True"

It's True

复合条件有not, and, or, not的优先级最高, or的优先级最低, and和or的求值是采用正则序的，即从左到右判断条件，有需要判断时才会对某个条件表达式进行求值，and时一旦有个条件为False，或or时一旦有条件为True，后面的条件判断不会进行下去了。and或or的返回值是最后一个进行求值的条件表达式值

>>> string1, string2, string3 = '', 'Trondheim', 'Hammer Dance'
>>> non_null = string1 or string2 or string3
>>> print non_null
Trondheim

不像c语言，python无法在条件判断中赋值。这样可以避免==和=易写错的情况

迭代

使用while进行迭代, continue, break等用法与C类似

i=0
while i<3:
    if i%2:
        print 'Odd:%d' % i
    else:
        pass
    i=i+1

while中的条件表达式与if中的相同。

使用for进行迭代，一般使用for…in sequence的语法，sequence可以是list,dictionary等

>>> a = ['Learn', 'python']
>>> for i in range(len(a)):
   print i, a[i]

0 Learn
1 python
 >>> for v in a:
    print v
 >>> d={'a':100, 'b':200}
>>> for key,value in d.items():
    print key,value

range用于生成list，一般用于遍历

>>> range(10)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> range(1, 11)
[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
>>> range(0, 30, 5)
[0, 5, 10, 15, 20, 25]
>>> range(0, 10, 3)
[0, 3, 6, 9]
>>> range(0, -10, -1)
[0, -1, -2, -3, -4, -5, -6, -7, -8, -9]

上面还提到, list等sequence一般都提供了comprehensions，使用for和表达式生成新的sequence

>>> [x**3 for x in range(1,3)]
[1, 8]
 >>> [(x, y**3) for x in range(1,3) for y in range(1,3)]  # 两层循环
[(1, 1), (1, 8), (2, 1), (2, 8)]
 >>> {x: x**2 for x in (2, 4, 6)}
{2: 4, 4: 16, 6: 36}
 >>> a = {x for x in 'abracadabra' if x not in 'abc'}
>>> a
set(['r', 'd'])

函数

使用def关键字定义函数，函数的参数，返回值与C类似, return语句没带值返回None，没有return语句，也返回None

>>> def fib2(n): # return Fibonacci series up to n
    """Return a list containing the Fibonacci series up to n."""
    result = []
    a, b = 0, 1
    while a < n:
        result.append(a)    # see below
        a, b = b, a+b
    return result
 >>> f100 = fib2(100)    # call it
>>> f100                # write the result
[0, 1, 1, 2, 3, 5, 8, 13, 21, 34, 55, 89]

函数和C++一样，可以带默认参数。默认参数可以是当前已知的变量

i=5
def f(arg=i):
    print arg
f()
i = 6
f()

默认参数只求值一次，所以上面两个f调用产生的结果一致.

参数还可以使用keyword的方式赋值

def parrot(voltage, state='a stiff', action='voom', type='Norwegian Blue'):
    print "-- This parrot wouldn't", action,
    print "if you put", voltage, "volts through it."
    print "-- Lovely plumage, the", type
    print "-- It's", state, "!"
 parrot(1000)                                          # 1 positional argument
parrot(voltage=1000)                                  # 1 keyword argument
parrot(voltage=1000000, action='VOOOOOM')             # 2 keyword arguments
parrot(action='VOOOOOM', voltage=1000000)             # 2 keyword arguments
parrot('a million', 'bereft of life', 'jump')         # 3 positional arguments
parrot('a thousand', state='pushing up the daisies')  # 1 positional, 1 keyword

注意下面几种情况是非法的

parrot()                     # required argument missing
parrot(voltage=5.0, 'dead')  # non-keyword argument after a keyword argument
parrot(110, voltage=220)     # duplicate value for the same argument
parrot(actor='John Cleese')  # unknown keyword argument

函数支持变参, 定义函数时，一个 * 号是多个参数列表, 两个 * 号参数按字典解析

def cheeseshop(kind, *arguments, **keywords):
    print "-- Do you have any", kind, "?"
    print "-- I'm sorry, we're all out of", kind
    for arg in arguments:
        print arg
    print "-" * 40
    keys = sorted(keywords.keys())
    for kw in keys:
        print kw, ":", keywords[kw]
 cheeseshop("Limburger", "It's very runny, sir.",
           "It's really very, VERY runny, sir.",
           shopkeeper='Michael Palin',
           client="John Cleese",
           sketch="Cheese Shop Sketch")

它将打印

-- Do you have any Limburger ?
-- I'm sorry, we're all out of Limburger
It's very runny, sir.
It's really very, VERY runny, sir.
----------------------------------------
client : John Cleese
shopkeeper : Michael Palin
sketch : Cheese Shop Sketch

调用函数时，也可以使用类似的 * 号标记来unpack参数列表或字典

>>> range(3, 6)             # normal call with separate arguments
[3, 4, 5]
>>> args = [3, 6]
>>> range(*args)            # call with arguments unpacked from a list
[3, 4, 5]

unpack字典参数

>>> def parrot(voltage, state='a stiff', action='voom'):
...     print "-- This parrot wouldn't", action,
...     print "if you put", voltage, "volts through it.",
...     print "E's", state, "!"
...
>>> d = {"voltage": "four million", "state": "bleedin' demised", "action": "VOOM"}
>>> parrot(**d)
-- This parrot wouldn't VOOM if you put four million volts through it. E's bleedin' demised !

lambda表达式

小的匿名函数可以使用lambda表达式代替(lambda表达式是函数式编程中的重要思想)

>>> def make_incrementor(n):
    return lambda x: x + n
>>> f = make_incrementor(42)
>>> f(0)
42
>>> f(1)
43

上面使用lambda返回一个函数，另一种表示是把lambda函数当参数

>>> pairs = [(1, 'one'), (2, 'two'), (3, 'three'), (4, 'four')]
>>> pairs.sort(key=lambda pair: pair[1])
>>> pairs
[(4, 'four'), (1, 'one'), (3, 'three'), (2, 'two')]

语言如果使用lambda，一般都要涉及局部变量(状态)，函数作为参数等概念，在一些函数式编程语言中，函数只是lambda的语法糖，即函数只是命了名的lambda表达式。

在sicp中提到可以使用过程来代替数据结构，来达到代码和数据的优雅统一。如

#使用过程来代替数据结构--序对
def cons(x,y):
    return lambda m: m and x or y
 #取第一个数
def car(z):
    return z(1)
 # 取第二个数
def cdr(z):
    return z(0)
 d=cons(100, cons(1000, 10000))
print car(d), car(cdr(d)), cdr(cdr(d))

上面例子中，通过使用返回的lambda，定义了序对数据结构，通过cons构造，car和cdr来取序对的值，从而实现了一个基础的
数据结构(lisp系的数据全是基于list的，而list又可以用序列表示)，而不用任何定义结构体的语句(这就是函数式编程语法简单的一个例子)。

python支持自省，就是说可以在函数，类的定义中加入文档

>>> def my_function():
...     """Do nothing, but document it.
...
...     No, really, it doesn't do anything.
...     """
...     pass
...
>>> print my_function.__doc__
Do nothing, but document it.
     No, really, it doesn't do anything.

python模块

python中每个py文件就是一个模块。每个模块中有个全局变量name标志模块名。在别的模块调用一个模块时，使用import语法，如在fibo.py中输入以下函数

def fib(n):    # write Fibonacci series up to n
    a, b = 0, 1
    while b < n:
        print b,
        a, b = b, a+b

def fib2(n): # return Fibonacci series up to n
    result = []
    a, b = 0, 1
    while b < n:
        result.append(b)
        a, b = b, a+b
    return result

然后，在另一个文件可以这样调用

import fibo
fibo.fib(1000)

import还存在另一种写法, 它把函数直接导入发起导入的模块的符号表中

>>> from fibo import fib, fib2
>>> fib(500)            # 不需要再加模块名了
1 1 2 3 5 8 13 21 34 55 89 144 233 377

或者全部导入

>>> from fibo import *
>>> fib(500)
1 1 2 3 5 8 13 21 34 55 89 144 233 377

当你使用

python fibo.py <arguments>

时，name被自动设置为”main“，所以你可以在py中加入如下的判断

if __name__ == "__main__":
    import sys
    fib(int(sys.argv[1]))

那么py即可以直接调用，也可以在别的模块中被引用。

python的模块搜索目录存在sys.path变量中，默认值包括三个:

>>> import sys
>>> print sys.path
['', 'C:\\Python27\\Lib\\idlelib', 'C:\\Python27\\lib\\site-packages\\setuptools-14.0-py2.7.egg', 'C:\\Python27\\lib\\site-packages\\sphinx-1.3b3-py2.7.egg', 'C:\\Python27\\lib\\site-packages\\colorama-0.3.3-py2.7.egg', 'C:\\Python27\\lib\\site-packages\\sphinx_rtd_theme-0.1.6-py2.7.egg', 'C:\\Python27\\lib\\site-packages\\alabaster-0.7.1-py2.7.egg', 'C:\\Python27\\lib\\site-packages\\babel-1.3-py2.7.egg', 'C:\\Python27\\lib\\site-packages\\pytz-2014.10-py2.7.egg', 'C:\\Python27\\lib\\site-packages\\pip-6.0.8-py2.7.egg', 'C:\\Windows\\system32\\python27.zip', 'C:\\Python27\\DLLs', 'C:\\Python27\\lib', 'C:\\Python27\\lib\\plat-win', 'C:\\Python27\\lib\\lib-tk', 'C:\\Python27', 'C:\\Python27\\lib\\site-packages']
>>> sys.path.append('/ufs/guido/lib/python')

使用dir来获取模块信息

>>> import fibo, sys
>>> dir(fibo)
['__name__', 'fib', 'fib2']
>>> dir(sys)  
['__displayhook__', '__doc__', '__excepthook__', '__name__', '__package__',
 '__stderr__', '__stdin__', '__stdout__', '_clear_type_cache',
 '_current_frames', '_getframe', '_mercurial', 'api_version', 'argv',
 'builtin_module_names', 'byteorder', 'call_tracing', 'callstats',
 'copyright', 'displayhook', 'dont_write_bytecode', 'exc_clear', 'exc_info',
 'exc_traceback', 'exc_type', 'exc_value', 'excepthook', 'exec_prefix',
 'executable', 'exit', 'flags', 'float_info', 'float_repr_style',
 'getcheckinterval', 'getdefaultencoding', 'getdlopenflags',
 'getfilesystemencoding', 'getobjects', 'getprofile', 'getrecursionlimit',
 'getrefcount', 'getsizeof', 'gettotalrefcount', 'gettrace', 'hexversion',
 'long_info', 'maxint', 'maxsize', 'maxunicode', 'meta_path', 'modules',
 'path', 'path_hooks', 'path_importer_cache', 'platform', 'prefix', 'ps1',
 'py3kwarning', 'setcheckinterval', 'setdlopenflags', 'setprofile',
 'setrecursionlimit', 'settrace', 'stderr', 'stdin', 'stdout', 'subversion',
 'version', 'version_info', 'warnoptions']

异常

捕获异常

python的捕获异常语法，如下例子

try:
    code_block()
except SomeException, e:
    do_some_thing_with_exception(e)
except (Exception1, Exception2), e:
    do_some_thing_with_exception(e)
except:
    do_some_thing_with_other_exceptions()
else:
    do_some_thing_when_success()
finally:
    do_some_thing()

其中，except可以使用else分支，来匹配try运行无异常的情况, finally是不管有无异常都会执行。

python2.7.x和python3.x的异常语法不太一样。

抛出异常

python使用raise来抛出异常

try:
    raise NameError, 'HiThere'
except NameError, a:
    print 'An exception flew by!'
    print type(a)

raise 函式的第一个参数是异常名，第二个是这个异常的实例，它存储在 instance.args 的参
数中。和 except NameError, a: 中的第二个参数意思差不多。

自定义异常

异常类中可以定义任何其他类中可以定义的东西，但是通常为了保持简单，只在其中加
入几个属性信息，以供异常处理句柄提取

class MyError(Exception):
    def __init__(self, value):
        self.value = value
    def __str__(self):
        return repr(self.value)
try:
    raise MyError(2*2)
except MyError, e:
    print 'My exception occurred, value:', e.value

如果一个新创建的模块中须抛出几种不同的错误时，一个通常的做法是为该模块定义一个异常基类，然后针对不同的错误类型派生出对应的异常子类。

类、对象

类的定义和实例化

一个简单的例子如下

>>> class MyClass:
    """A simple class."""           #__doc__
    i=10000
    def __init__(self, p1, p2):     # 构造函数
        self.r = p1
        self.i = p2
    def f(self):                    
        print self.r+self.i
 >>> x = MyClass(3.0, -4.5)          # 实例化
>>> x.r, x.i
(3.0, -4.5)
>>> x.f()
-1.5

需要注意的是，定义一个类时，python会产生一个类对象。类对象中属性、函数可以修改

>>> del MyClass.i
>>> del MyClass.f
>>> MyClass.j=10000

类对象中可以使用 doc打印类定义中的帮助字符串

实例化类的后，就产生了一个实例对象。实例对象中的属性也可以修改，如上面MyClass对象
没有定义j属性，但是在它赋值时会自动创建一个

>>> x.j = 1000
>>> del x.j

实例对象中的函数和MyClass中的函数看起来不太一样。大家注意到类对象中定义函数时第一
个参数总是self，而调用实例对象中的函数时，可以少加一个参数，事实上如下的调用是完全等价的

>>> x.f()
-1.5
>>> MyClass.f(x)
-1.5

类变量和实例变量

>>> class Dog:
    kind = 'canine'         # 类变量，被所有实例共享
    def __init__(self, name):
        self.name = name    # 实例变量
        # self.__class__.kind = 'bbb'  # 修改类变量
 >>> d = Dog('Fido')
>>> e = Dog('Buddy')
>>> print d.kind, e.kind, Dog.kind
canine canine canine
>>> e.kind = 'bbbb'         # 注意kind已经变成e的实例变量
>>> print d.kind, e.kind, Dog.kind  # d中没有kind实例变量，所以d.kind还是类中的变量
canine bbbb canine
>>> Dog.kind = 'kkkk'
>>> print d.kind, e.kind, Dog.kind
kkkk bbbb kkkk              # d.kind仍与Dog.kind一样

继承

使用如下语法继承或多重继承

class DerivedClassName(BaseClassName1, BaseClassName2):
    
    .
    .
    .
    N>

子类中可以使用 BaseClassName.methodname(self, arguments) 调用父类的方法

python 还提供两个函数用于实例检查:

isinstance, 如instance(obj, int)检测obj是否是int类型
issubclass, 如issubclass(bool, int)检测bool是否是int的子类

多重继承时，规则是深度优先，从左到右。如下面的例子，搜索一个变量是否存在时，顺序是DerivedClassName
然后是BaseClassName1，BaseClassName1的父类，BaseClassName2等。

私有变量

一个变量前面以及下划线开始会被当成私有变量，不管它是函数还是属性。

标准库

多线程

threading 模块主要功能是让一些线程的操作对象化了，创建了叫 Thread 的类。
使用线程有两种方法:

一种是创建线程要执行的函式，把这个函式传递进 Thread 对象里，让它来执行，如下所示。

# -*- coding: utf-8 -*-
import string, threading, time

def thread_main(a):
    global count, mutex
    # 获得线程名
    threadname = threading.currentThread().getName()

    for x in xrange(0, int(a)):
        # 取得锁
        mutex.acquire()
        count = count + 1
        print threadname, x, count
        # 释放锁
        mutex.release()
        time.sleep(1)

def main(num):
    global count, mutex
    threads = []

    count = 1
    # 创建一个锁
    mutex = threading.Lock()
    # 先创建线程对象
    for x in xrange(0, num):
        threads.append(threading.Thread(target=thread_main, args=(5,)))
    # 启动所有线程
    for t in threads:
        t.start()
    # 主线程中等待所有子线程退出
    for t in threads:
        t.join()
if __name__ == '__main__':
    num = 2
    # 创建2个线程
    main(num)

第二种方法是直接从 Thread 继承，创建一个新的类，把线程执行的代码放到这个新类里，如下所示。

# -*- coding: utf-8 -*-
import threading
import time

class Test(threading.Thread):
    def __init__(self, num):
        threading.Thread.__init__(self)
        self._run_num = num

    def run(self):
        global count, mutex
        threadname = threading.currentThread().getName()
        for x in xrange(0, int(self._run_num)):
            # 取得锁
            mutex.acquire()
            count = count + 1
            print threadname, x, count
            # 释放锁
            mutex.release()
            time.sleep(1)

if __name__ == '__main__':
    global count, mutex
    threads = []
    num = 2
    count = 1
    # 创建锁
    mutex = threading.Lock()
    # 创建线程对象
    for x in xrange(0, num):
        threads.append(Test(5))
    # 启动线程
    for t in threads:
        t.start()
    # 等待子线程结束
    for t in threads:
        t.join()

上述输出类似

mymac:code vincent$ python threading_1.py
Thread-1 0 2
Thread-2 0 3
Thread-1 1 4
Thread-2 1 5
Thread-1 2 6
Thread-2 2 7
Thread-1 3 8
Thread-2 3 9
Thread-1 4 10
Thread-2 4 11

文件目录操作

文件路径

os.path 是一个与平台无关的文件路径处理模块。它可以帮助我们解决在程序处理中碰到
的一些复杂的路径处理问题，我们用简单的字符串拆分这些路径处理问题是很困难或者无法完成的，但是 os.path 都替你做好了解决方案，你只须使用
它里面的函式就可以了。

os.path.basename 返回文件名
os.path.dirname 返回路径名
os.path.commonprefix 从一组路径中，找到共同的路径前缀
os.path.join，组合一些零散的字符串，生成一个安全的路径表示
os.path.normpath 处理不规则路径字符串，将其转化为正常的路径
os.path.abspath 获取绝对路径

目录操作

目录操作，一般使用os模块和shutil模块

# 存在目录，删除原来目录，重新创建目录
if os.path.isdir(gDstDir):
    shutil.rmtree(gDstDir)
os.makedirs(gDstDir);   

# 遍历目录、文件，取java文件
for root, dirs, files in os.walk(gSrcDir): 
    for nd in [root+os.sep+d for d in dirs]:
        print "dir: %s" % nd
    for nf in [root+os.sep+f for f in files if f.endswith(".java")]:
        print "file: %s" %nf

文件复制、删除

文件操作也使用os模块和shutil

>>> shutil.copyfile('data.db', 'archive.db')
>>> shutil.move('/build/executables', 'installdir')
>>> os.remove('data.db')

文件读写

文件读写与c中类似

# 读取全部内容
content = open(sf,'r').read()
# 按行读
lines = open(sf,'r').readlines()
for l in lines:
    print l
 # 写入文件
ofd = open(df, 'w')
ofd.write('aaa')
ofd.close()

socket

tcp客户端代码:

#coding:utf-8
'''
Created on 2013-10-21

@author: vincent
'''

import socket
import time
from threading import Thread,Lock

class SocketThread(Thread):
    def __init__(self): 
        print 'geturllwork\r\n'
        Thread.__init__(self)
    def run(self):
        sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
        sock.connect(('192.168.2.119', 8001))
        time.sleep(2)
        sock.send('aaaaaaaaa')
        print sock.recv(1024)
        sock.close()
        time.sleep(1)

if __name__ == '__main__':
    dealUrlThreads=[]
    for i in xrange(10000):
        dealUrlThreads.append(SocketThread())
        dealUrlThreads[i].start()   

    for t in dealUrlThreads:
        t.join()

tcp服务端代码:

#coding:utf-8
'''
Created on 2013-10-21

@author: vincent
'''

import socket

if __name__ == '__main__':
    sock = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
    sock.bind(('localhost', 8001))
    sock.listen(5)
    while True:
        connection,address = sock.accept()
        try:
            connection.settimeout(5)
            buf = connection.recv(1024)
            if buf == '1':
                connection.send('welcome to server!')
            else:
                connection.send('please go out!')
        except socket.timeout:
            print 'time out'
        connection.close()

udp客户端代码:

#coding:utf-8
'''
Created on 2013-10-21

@author: vincent
'''
import sys,socket

host = sys.argv[1]
textport = sys.argv[2]

s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)


#s.bind(('', 54320))
try:
    port = int(textport)
except ValueError:
    port = socket.getservbyname(textport, 'udp')
s.connect((host, port))
while 1:
    #print "Enter data to transmit:"
    #data = sys.stdin.readline().strip()
    data = 'mydata'
    s.sendall(data)
    print "Looking for replies; press Ctrl-C or Ctrl-Break to stop."
    buf = s.recv(2048)
    #buf = s.recvfrom()
    if not len(buf):
        break
    print "Server replies: ",
    sys.stdout.write(buf)
    print "\n"

udp服务端代码:

#coding:utf-8
'''
Created on 2013-10-21

@author: vincent
'''

import socket, traceback

host = ''
port = 54321

s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
s.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
s.bind((host, port))

while 1:
    try:
        message, address = s.recvfrom(2048)
        print "Got data from", address, ": ", message+".echo"
        s.sendto(message, address)
    except (KeyboardInterrupt, SystemExit):
        raise
    except:
        traceback.print_exc()

正则表达式

正则表达式语法

python使用的是perl系的正则表达式语法。具体语法可以查看python文档中的re模块，这里只列表常见的

., *, ?, +, 不解释
^, $, 匹配行首行尾, 在多行匹配模式下,会匹配每行
*?, +?, ??，没加?是贪婪匹配，加了?后是最短匹配
{m} 刚好m个
{m,n} 和 {m,n}?，匹配m到n个，加?最少匹配
\，转义字符，上述 ? 等需要转义
[], 字符集合, 在 [] 中除了 ]` 需要转义，其他 ```* 等，只当字符，另外 \w 也可用，第一个字符是 ^，则表示排除后面的字符
|，或者 A|B 表示，或者匹配A或者匹配B, 如果是 | 字符，则需要加转义
(...) 匹配组，通过加括号，把匹配的结果按组捕获
\number ，重复匹配项目，如 (.+) \1 将匹配 55 55
(?P...) 和 (?P=name)，给匹配的组加了个name，与上两条匹配和引用的方式相似。
(?:...) 组，但是不捕获结果
(?=...) 前向匹配
(?!...) 前向不匹配
(?<=...) 后向匹配
(?<！...) 后向不匹配
(?(id/name)yes-pattern|no-pattern) 如果group 存在匹配yes-pattern，如果不存在匹配no-pattern，group是否存在通过id或name进行判断
\d, \w, \s 分别表示数字、字母和数字、空白字符
\D, \W, \S 分别表示非数字、非字母也非数字、非空白字符

正则表达式工具(RegexBuddy)

复杂的正则表达式可能很容易写错，可以借助正则表达式工具进行测试，推荐regexbuddy，下图所示了使用regexbuddy测试，匹配objective-c中类中属性的正则表达式。

使用正则表达式进行匹配

上面介绍了正则的语法，还有测试正则语法的工具。下面介绍python下如果使用正则匹配，并获取匹配的结果

re.search(pattern, string, flags=0)

从string中查找pattern,如果符合pattern,则返回一个match的对象,否则返回None

re.match(pattern, string, flags=0)

match与search类似，只不过它是判断整个字符串是否匹配

>>> import re
>>> p='a{3}'
>>> re.search(p,'bbbbaaaddd')
<_sre.SRE_Match object at 0x01DF7950>
>>> re.match(p, 'bbbbaaaddd')
>>> re.match('\w*', 'bbbbaaaddd')
<_sre.SRE_Match object at 0x01DF79C0>

match对象的group, groups函数可以获取捕获的group信息

>>> p='''(\w*(a{3})\w*(\1))'''
>>> gg=re.match(p,'bbbbaaadddaaa')
>>> gg.group()
'bbbbaaaddd'
>>> gg.groups()
('bbbbaaaddd', 'aaa')

re.compile(pattern, flags=0)

经常使用的正则模式，可以使用compile，提高效率

re.findall(pattern, string, flags=0)

findall从正则中获取匹配后的group，一般比较实用，如上面获取属性的例子

import re
# 一般加re.S表示.也可以匹配\n
pp = re.compile(r'''(?i)(?:@property.*?\)\s*?(\w.*?);)''', re.S)
test=r"""
@interface ChannelAttribute : PortalBaseObject
// XXX: 频道id
// 频道号
@property (nonatomic, strong) NSString *channelCode;
 // 频道名称
@property (nonatomic, strong) NSString *caption;
 // 频道logo图片的地址，相对路径
@property (nonatomic, strong) NSString *logo;
 // OTT/VOD
@property (nonatomic, strong) NSString *serviceCode;
"""
 propertys = re.findall(pp, test)
for p in propertys:
    print p

上述例子将输出该类的所有属性

NSString *channelCode
NSString *caption
NSString *logo
NSString *serviceCode

re.sub(pattern, repl, string, count=0, flags=0)

把符合pattern的部分替换成repl，repl可以是新字符串，或者更复杂的函数

>>> t="111 222 333"
>>> re.sub('\d*(?=\s|$)', '444', t)
'444 444 444'
 def add100(matched):
    intStr = matched.groups()[0]
    intValue = int(intStr)
    return str(intValue+100)
 # 匹配的数全部替换成+100
>>> re.sub('(\d*)(?=\s|$)', add100, t)
'211 322 433'

参数解析库

使用命令行，经常要复杂的参数。可以使用OptionParser库，如有下列格式的参数

epgTool [-f ][-D ][-d ]

则可以使用OptionParser解析如下

from optparse import OptionParser
from datetime import *
 MSG_USAGE = "epgTool [-f ][-D ][-d ]"
 optParser = OptionParser(MSG_USAGE)
optParser.add_option("-f","--file",action = "store",type="string",dest = "filename")
optParser.add_option("-D","--dir",action = "store",type="string",dest = "dir")
optParser.add_option("-d","--date",action = "store",type="string",dest = "date")

options, args = optParser.parse_args()
 # 解析后，-f, -D, -d 后面跟的参数，存到下面变量中
print options.filename, options.dir, options,date
 if len(sys.argv)<=1:
    optParser.print_help()
    exit()
elif options.filename == None and options.dir==None:
    optParser.print_help()
    exit()
if options.date == None:
    day = date.today()
else:
    day = datetime.strptime(options.date,dateFmt).date()
    if day == None:
        print 'error: day format must like: 14/05/20'
        exit()

其他常见库

网络库pyurl

curl库是c下的用来发http请求的工具，python下有对应的实现pycurl，安装方法仍使用pip，简单的使用例子如下:

#encoding:utf8
'''
Created on 2011-4-28

@author: vincent
'''

import pycurl,urllib
import StringIO

# 需要伪装
def getHtmlRead(url):
    c = pycurl.Curl()
    c.setopt(pycurl.URL, url)
    c.setopt(pycurl.USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; "\
                                "Windows NT 5.1; SV1; .NET CLR 2.0.50727)")
    b = StringIO.StringIO()
    c.setopt(pycurl.WRITEFUNCTION, b.write)
    c.setopt(pycurl.FOLLOWLOCATION, 1)
    c.setopt(pycurl.MAXREDIRS, 5)  
#    c.setopt(pycurl.CONNECTTIMEOUT, 60)   
#    c.setopt(pycurl.TIMEOUT, 300)
    try:
        c.perform()
    except Exception as e:
        print "html read error\r\n"
        return None
    return b.getvalue()

def postHtmlRead(url,data):
    c = pycurl.Curl()
    c.setopt(pycurl.URL, url)
    c.setopt(pycurl.USERAGENT, "Mozilla/4.0 (compatible; MSIE 6.0; "\
                                "Windows NT 5.1; SV1; .NET CLR 2.0.50727)")
    b = StringIO.StringIO()
    c.setopt(pycurl.WRITEFUNCTION, b.write)
    c.setopt(pycurl.POSTFIELDS,  urllib.urlencode(data))
    c.setopt(pycurl.FOLLOWLOCATION, 1)
    #c.setopt(pycurl.HEADER, 1)
    #c.setopt(pycurl.CONNECTTIMEOUT, 0)
    c.setopt(pycurl.MAXREDIRS, 5)
    #c.setopt(pycurl.COOKIEJAR, "cookie.txt")
    try:
        c.perform()
    except Exception as e:
        print "html read error\r\n"
        return None
    return b.getvalue()

py2exe window下打包发布

一般情况下，只要把脚本，或pyc文件，或zip包(2.7后才支持)发布即可。但是，对于window，由于默认没有安装python环境，如果让普通用户都去安装一个python环境，并设置一大堆环境，可能不是很方便，这时可以考虑用python发布模块。Python发布模块有很多种，这里只介绍较早使用的py2exe，它能把py脚本，打包成exe和python运行所有的dll文件，用户直接执行exe就行了(缺点是打包的dll文件一般都较大，能有20几M)。

安装py2exe

easy_install py2exe

完成主功能模块后，在功能模块对应的目录下，添加setup.py，并设置类似如下:

from distutils.core import setup
import py2exe

includes = ["encodings", "encodings.*"]
options = {"py2exe":
    {"compressed": 1,
     "optimize": 2,
     "ascii": 1,
     "includes":includes,
     "bundle_files": 1}
}
setup(
    options = options,
    zipfile=None,

    # The first three parameters are not required, if at least a
    # 'version' is given, then a versioninfo resource is built from
    # them and added to the executables.
    version = "0.1.0",
    description = "urlsign",
    name = "urlsign",

    # targets to build
    # windows = ["test_wx.py"],
    console = ["urlsign.py"]
#    console = ["hello.py"]
    )

python setup.py py2exe

运行上面命令，全产生一个dist子目录，把该目录下的exe和一些dll文件发布即可。

你可能感兴趣的:(Language)

XML的介绍及使用DOM，DOM4J解析xml文件 late summer182 xml java
1XML简介XML（可扩展标记语言，ExtensibleMarkupLanguage）是一种用于定义文档结构和数据存储的标记语言。它主要用于在不同的系统之间传输和存储数据。作用：数据交互配置应用程序和网站Ajax基石特点XML与操作系统、编程语言的开发平台无关实现不同系统之间的数据交换2XML文档结构王珊.NET高级编程包含C#框架和网络编程等李明明XML基础编程包含XML基础概念和基本作用2.1
前端基础入门：HTML、CSS 和 JavaScript 阿绵前端前端 html css js
在现代网页开发中，前端技术扮演着至关重要的角色。无论是个人网站、企业官网，还是复杂的Web应用程序，前端开发的基础技术HTML、CSS和JavaScript都是每个开发者必须掌握的核心技能。本文将详细介绍这三者的基本概念及其应用一、HTML——网页的骨架HTML（HyperTextMarkupLanguage）是构建网页的基础语言。它是网页的结构和内容的标记语言，决定了网页上的文本、图像、表单等元
Hive的ReduceJoin/MapJoin/SMBJoin for your wish Hive 面试Interview hive hadoop
Hive中就是把Map，Reduce的Join拿过来，通过SQL来表示。参考链接：LanguageManualJoins-ApacheHive-ApacheSoftwareFoundation1.Reduce/Common/ShuffleJoinReduceJoin在Hive中也叫CommonJoin或ShuffleJoin它会进行把相同key的value合在一起，正好符合我们在sql中的join
LLaMA系列大模型调研与整理-llama-alpaca-lora AI大模型-大飞 llama AI大模型 AI 职场和发展人工智能
文章目录LLaMA大模型及其衍生模型1.LLaMA2.stanford_alpaca3.ChatDoctor4.alpaca-lora5.Chinese-LLaMA-Alpaca6.BELLE大模型综述ASurveyofLargeLanguageModels关键词：大模型，LLaMA，Alpaca，Lora，Belle，模型训练，模型微调，指令微调最近尝试在领域数据进行生成式大模型的再训练和微调，
[论文笔记] Cost-Effective Hyperparameter Optimization for Large Language Model Generation 大型语言模型生成推理超参优化心心喵论文笔记论文阅读语言模型人工智能
成本效益高的大型语言模型生成推理的超参数优化https://openreview.net/pdf?id=DoGmh8A39OChiWang1,SusanXueqingLiu2,AhmedH.Awadallah11微软研究院，雷德蒙德2史蒂文斯理工学院摘要大型语言模型（LLMs）因其生成能力引发了广泛关注，催生了各种商业应用。使用这些模型的高成本驱使应用构建者在有限的推理预算下最大化生成的价值。本文
深入解析LangChain4j中的ChatLanguageModel API：从基础到高级应用泰山AI 精品专栏 microsoft langchain4j java ai
聊天与语言模型|LangChain4j注意本页描述的是低级别的LLMAPI。有关高级LLMAPI，请参见AIServices。支持的所有LLMProviderStreamingTools(sync/streaming)JSONSchemaJSONModeSupportedModalities(Input)ObservabilityLocalDeploymentSupportsNativeImage
基本的SELECT语句程序员小柴 MySQL oracle 数据库 mysql
1.SQL概述SQL（StructuredQueryLanguage）是一种用于管理和操作关系数据库的编程语言。它是一种标准化的语言，用于执行各种数据库操作，包括创建、查询、插入、更新和删除数据等。SQL语言具有简单、易学、高效的特点，可以用于处理大量的数据和复杂的查询。它包含了一系列的命令和语句，可以通过这些命令和语句来操作数据库。SQL语言的主要功能包括：数据定义语言（DDL）：用于创建和管理
【目标检测】多模态航空目标检测：A SIMPLE AERIAL DETECTION BASELINE OF MULTIMODAL LANGUAGE MODELS 慕容紫英问情目标检测目标检测人工智能计算机视觉
阅读并理解一篇论文：ASIMPLEAERIALDETECTIONBASELINEOFMULTIMODALLANGUAGEMODELS该文首次提出了一种将多模态语言模型应用于航空检测的简单基线方法，名为LMMRotate。贡献：具体而言，首先引入一种归一化方法，将检测输出转换为文本输出，以适配多模态语言模型框架。接着，提出一种评估方法，确保多模态语言模型与传统目标检测模型之间能够进行公平比较。通过微
【LLM】大模型基础--大规模预训练语言模型的开源教程笔记 Langchain 笔记人工智能 langchain llama 大模型产品经理大模型基础
1.引言本文以DataWhale大模型开源教程为学习路线，进行一整个大模型的入门操作什么是语言模型语言模型是一种对词元序列（token）的概率分布，可以用于评估文本序列的合理性并生成新的文本。从生成文本的方式来看，LM（languagemodle）可以简单的分为：自回归模型非自回归模型特点逐字生成文本，每个词的生成都依赖于上文，关联性好一次性生成整个文本序列，不捕捉上文信息优点内容质量高生成速度快
书籍-《掌握Transformer：从BERT到大模型和Stable Diffusion（第二版）》
书籍：MasteringTransformers:TheJourneyfromBERTtoLargeLanguageModelsandStableDiffusion，2ndEdition作者：SavaşYıldırım，MeysamAsgari-Chenaghlu出版：PacktPublishing编辑：陈萍萍的公主@一点人工一点智能下载：书籍下载-《掌握Transformer：从BERT到大模型
大语言模型（LLM）如何实现上下文的长期记忆？
引言大语言模型（LargeLanguageModels,LLMs），如GPT-4、Claude和LLaMA等，已经在自然语言处理领域展现出卓越的能力。然而，它们在实际应用中常常面临一个核心问题：如何实现上下文的长期记忆？传统LLM的上下文长度通常受限于计算资源和架构设计（如注意力机制），这限制了其处理长文档或保持复杂对话连续性的能力。本篇文章将深入探讨大语言模型的上下文记忆问题，分析其技术难点，并
html+css网页设计，我的网站软件技术NINI html/css笔记 javascript html css
一、技术简介HTML：超文本标记语言（HyperTextMarkupLanguage），用于创建网页的基本结构和内容。CSS：层叠样式表（CascadingStyleSheets），用于设置网页的样式和布局，包括字体、颜色、边距、对齐方式等。JavaScript：一种用于创建动态和交互式网页的脚本语言。通过JavaScript，可以实现网页的动画效果、表单验证、数据交互等功能。二、创建多页网站的基
语音与自然语言处理（NLP）：智能交互的核心技术给生活加糖！热门知识自然语言处理交互人工智能
随着人工智能（AI）技术的飞速发展，语音识别与自然语言处理（NaturalLanguageProcessing,NLP）成为了智能交互系统的核心技术。它们不仅改变了人们与计算机、设备的交互方式，也推动了众多行业的革新。从智能助手（如苹果的Siri、亚马逊的Alexa）到机器翻译、自动客服系统，语音和NLP技术正逐步融入日常生活，改善我们与数字世界的沟通方式。一、什么是语音识别与自然语言处理（NLP
笔记-《A Survey of Large Language Models》- 尾声 L_serein 玩转LLM 笔记语言模型人工智能
尾声:尾声:本综述是由我们研究团队在一次讨论会上计划的,我们旨在总结LLM的最新进展,为我们的团队成员提供一份高度可读性的报告。第一稿于2023年3月13日完成,我们的团队成员尽最大努力以相对客观、全面的方式囊括有关LLM的相关研究。接着,我们进行了多次细致的写作和内容修订。尽管我们付出了巨大的努力,但这份综述仍远非完美:我们可能会遗漏重要的参考文献或主题,也可能存在不严谨的表述或讨论。由于空间有
nlp技术 tqs_12345 人工智能自然语言处理
自然语言处理（NaturalLanguageProcessing,NLP）技术是一种计算机科学与人工智能的交叉领域，涉及机器对人类语言进行处理和理解的能力。以下是一些常见的NLP技术的示例：1.机器翻译：NLP技术可以帮助机器将一种语言翻译成另一种语言。例如，谷歌翻译使用NLP技术实现自动翻译，用户可以输入一段文本，然后谷歌翻译会自动将其翻译成其他语言。2.文本分类：NLP技术可以将文本分类到不同
架构设计（4）面向服务架构SOA与C++模拟实现 CoderIsArt 架构设计研究 C++11 架构面向服务架构SOA
SOA架构SOA（面向服务的架构）是一种架构风格，通过将系统划分为服务来提高灵活性和可维护性。每个服务是一个独立的功能模块，通过标准化接口进行交互。SOA架构涉及多种技术和组件，以下是关键技术和它们的作用：1.服务设计与接口-服务接口定义：通常使用标准接口描述语言，如WSDL（WebServicesDescriptionLanguage）或OpenAPI（Swagger）来定义服务的接口。接口描述
理论一、大模型—概念伯牙碎琴大模型自然语言处理 ai
一、总述大模型通常指的是参数规模庞大、训练难度较高的人工智能模型。随着深度学习技术的发展，研究人员和企业越来越倾向于构建更大的模型，以提高模型的性能和泛化能力。这些大模型往往需要大量的数据和计算资源来训练，并且在实际应用中通常表现出色。大模型全称是大型语言模型（LLM，LargeLanguageModel），这个“大”主要指模型结构容量大，结构中的参数多，用于预训练大模型的数据量大。一个大模型可以
领域驱动设计（DDD）是什么？——从理论到实践的全方位解析小胡说技书 Java+SSM+DB java 领域驱动设计（DDD）架构领域模型微服务
文章目录一、引言二、核心概念与定位2.1DDD定义与核心理念2.2DDD关键元素三、底层原理与技术细节3.1领域模型与普适语言3.1.1领域模型3.1.2普适语言（UbiquitousLanguage）3.2战术设计模式详解3.2.1实体、值对象、聚合与领域服务3.2.2无状态函数在领域服务中的应用3.2.3工厂与仓储模式3.3战略设计：限界上下文与防腐层3.3.1限界上下文（BoundedCon
《一文吃透！NLTK与SpaCy，自然语言处理的神兵利器》人工智能深度学习
在人工智能的璀璨星空中，自然语言处理（NLP）无疑是最为耀眼的领域之一。它让机器能够理解、处理和生成人类语言，极大地推动了智能交互的发展。而在Python的NLP工具库中，NLTK和SpaCy就像两把锋利的宝剑，各自散发着独特的光芒。今天，就让我们深入探究这两款工具的使用技巧与优势，为你的NLP之旅增添强大助力。一、NLTK：自然语言处理的瑞士军刀NLTK（NaturalLanguageToolk
大语言模型常用微调与基于SFT微调DeepSeek R1指南知来者逆 LLM 深度学习人工智能自然语言处理 DeepSeek SFT 微调
概述大型语言模型（LLM，LargeLanguageModel）的微调（Fine-tuning）是指在一个预训练模型的基础上，使用特定领域或任务的数据对模型进行进一步训练，以使其在该领域或任务上表现更好。微调是迁移学习的一种常见方法，能够显著提升模型在特定任务上的性能。在大型语言模型（LLM）的微调中，有几种常见的方法，包括SFT（监督微调）、LoRA（低秩适应）、P-tuningv2和**Fre
InfiniteHiP - 在单个GPU上扩展 LLM 上下文至300万tokens 伊织code #Paper Reading InfiniteHiP 推理 GPU LLM token
InfiniteHiP:ExtendingLanguageModelContextUpto3MillionTokensonaSingleGPUPaper:https://huggingface.co/papers/2502.08910Sourcecode:https://github.com/DeepAuto-AI/hip-attention/SGLangIntegrationavailablen
MySQL数据库三：操作数据库（二）嘵奇 MySQL 数据库 mysql
DQL查询数据（重点）DataQueryLanguage：数据查询语言●所有的查询操作都用它Select●简单的查询，复杂的查询它都能做●数据库中最核心的语言，最重要的语句●使用频率最高的语句基本查询代码演示：--简单查询语句SELECT*FROM`class`--查询表的全部信息SELECT`id`,`name`FROM`class`--查询表的指定信息SELECT`id`AS学号,`name`
后端学习前端-html+css 想要变瘦的小码头后端学前端前端学习 html
第一章.HTML与CSSHTML是什么：即HyperTextMarkuplanguage超文本标记语言，咱们熟知的网页就是用它编写的，HTML的作用是定义网页的内容和结构。HyperText是指用超链接的方式组织网页，把网页联系起来Markup是指用的方式赋予内容不同的功能和含义CSS是什么：即CascadingStyleSheets级联（层叠）样式表，它描述了网页的表现与展示效果1.HTML元素
Expand Reach with Multilingual Data Editors SEO-狼术 Delphi net Crack 开发语言
ExpandReachwithMultilingualDataEditorsEnhanceuserexperience,accessibility,andglobalcollaborationwithlocalizeddataeditorsthatadapttomultiplelanguageworkflows.Localizationistheprocessofadaptingtheuserin
大模型转换为 GGUF 奔跑中的小象 AI GGUF
一、GGUF介绍GGUF格式的全名为（GPT-GeneratedUnifiedFormat），提到GGUF就不得不提到它的前身GGML（GPT-GeneratedModelLanguage）。GGML是专门为了机器学习设计的张量库，最早可以追溯到2022/10。其目的是为了有一个单文件共享的格式，并且易于在不同架构的GPU和CPU上进行推理。但在后续的开发中，遇到了灵活性不足、相容性及难以维护的问
30分钟学会HTML 奇偶变不变 html 前端
HTML基本语法HTML（HyperTextMarkupLanguage）是构成网页内容的基础。它使用一系列的标签来描述网页的结构，包括文本、图片、链接等元素。浏览器会解析这些标签并渲染成我们看到的网页。在线体验一下CodePen(在线HTML编辑器)。千万不要被「超文本」、「标记语言」吓到，HTML的语法非常直观，常用的标签结构并不复杂，用于构建基础网页已经足够，稍微了解一下就能上手。就是这些基
本地部署的DeepSeek-R1-32B与DeepSeek-R1-7B模型效果对比 MaxCode-1 搭建本地gpt Deepseek
本地部署的DeepSeek-R1-32B与DeepSeek-R1-7B模型效果对比在当今人工智能快速发展的时代，大语言模型（LargeLanguageModel,LLM）的应用场景日益广泛。无论是企业级应用还是个人开发，本地部署大语言模型已经成为一种趋势。DeepSeek-R1-32B和DeepSeek-R1-7B作为DeepSeek系列中的两个重要版本，分别代表了不同规模和性能的模型。本文将从多
23. AI-大语言模型真上帝的左手 23.AI 人工智能语言模型自然语言处理
文章目录前言一、LLM1.简介2.工作原理和结构3.应用场景4.最新研究进展5.比较二、Transformer架构1.简介2.基本原理和结构3.应用场景4.最新进展三、开源1.开源概念2.开源模式3.模型权重四、再谈DeepSeek前言AI‌一、LLMLLM（LargeLanguageModel，大语言模型）‌1.简介 LLM（LargeLanguageModel，大语言模型）‌是指使用大量文本
UMLS初探愉悦的麻婆豆腐人工智能健康医疗
什么是UMLSUMLS（UnifiedMedicalLanguageSystem，统一医学语言系统），简单来说就是将不同的医学标准统一到一套体系的系统，主要为了医疗系统的统一而构建出的。UMLS的主要组成部分Metathesaurus：一个包含多个医学术语系统的元数据库，旨在统一和映射不同来源的医学概念。SemanticNetwork：一个包含语义分类和关系的网络。它可以帮助用户识别概念之间的语义
.NET 8 粉红笔记 .net
.NET8是微软于2021年8月24日宣布的下一代编程语言和框架，它是.NET宇宙的一部分，与C#(CommonLanguageInfrastructure)紧密集成。.NET8引入了许多新功能，如原生编译、值类型(ValueTypes)、结构化并发(structuredconcurrency)和快速数组(RapidArray)。.NET8还支持本机(native)AOT(Ahead-Of-Tim
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http