pyscws4 是一个python的分词程序

pyscws4 是一个python的分词程序 | mei year-美叶专注思想。

     pyscws4 是一个python的分词程序
    Posted on 2012 年 11 月 15 日 by dingyangfan

    注意：pyscws4 是一个python的分词程序，抄袭至：马明练开发的php版的pscws4 地址是：http://www.ftphp.com/scws/ 。

    翻译了两个文件:

    1. pscws4.php

    2.xdb_r.php

    希望高人可以帮我优化一下代码

    规则文件和词典下载：

    分词.tar

    pyscws4.py文件源码：
    view source
    001    #coding=gbk
    002    from __future__ import division
    003    from collections import OrderedDict
    004    from xdb_r import XDB_R
    005    import math ,struct,copy
    006    import sys,time
    007    reload(sys)
    008    sys.setdefaultencoding('gbk')
    009    ''' defines for ruleset '''
    010    PSCWS4_RULE_MAX     = 31    # just 31, PHP do not support unsigined Int
    011    PSCWS4_RULE_SPECIAL=    0x80000000
    012    PSCWS4_RULE_NOSTATS=    0x40000000
    013    PSCWS4_ZRULE_NONE= 0x00
    014    PSCWS4_ZRULE_PREFIX=    0x01
    015    PSCWS4_ZRULE_SUFFIX=    0x02
    016    PSCWS4_ZRULE_INCLUDE=   0x04    # with include
    017    PSCWS4_ZRULE_EXCLUDE=   0x08    # with exclude
    018    PSCWS4_ZRULE_RANGE =    0x10    # with znum range
    019
    020    ''' defines for mode of scws <= 0x800 '''
    021    PSCWS4_IGN_SYMBOL= 0x01
    022    PSCWS4_DEBUG=           0x02
    023    PSCWS4_DUALITY=     0x04
    024
    025    ''' multi segment policy >= 0x1000 '''
    026    PSCWS4_MULTI_NONE=    0x0000        # nothing
    027    PSCWS4_MULTI_SHORT= 0x1000      # split long words to short words from left to right
    028    PSCWS4_MULTI_DUALITY=   0x2000      # split every long words(3 chars?) to two chars
    029    PSCWS4_MULTI_ZMAIN=   0x4000        # split to main single chinese char atr = j¦a¦n?¦v?
    030    PSCWS4_MULTI_ZALL= 0x8000      # attr = ** , all split to single chars
    031    PSCWS4_MULTI_MASK= 0xf000      # mask check for multi set
    032    PSCWS4_ZIS_USED=        0x8000000
    033
    034    ''' single bytes segment flag (纯单字节字符) '''
    035    PSCWS4_PFLAG_WITH_MB=   0x01
    036    PSCWS4_PFLAG_ALNUM= 0x02
    037    PSCWS4_PFLAG_VALID= 0x04
    038    PSCWS4_PFLAG_DIGIT= 0x08
    039    PSCWS4_PFLAG_ADDSYM=    0x10
    040
    041    ''' constant var define '''
    042    PSCWS4_WORD_FULL=       0x01    # 多字: 整词
    043    PSCWS4_WORD_PART=       0x02    # 多字: 前词段
    044    PSCWS4_WORD_USED=       0x04    # 多字: 已使用
    045    PSCWS4_WORD_RULE=       0x08    # 多字: 自动识别的
    046
    047    PSCWS4_ZFLAG_PUT=       0x02    # 单字: 已使用
    048    PSCWS4_ZFLAG_N2=        0x04    # 单字: 双字名词头
    049    PSCWS4_ZFLAG_NR2=       0x08    # 单字: 词头且为双字人名
    050    PSCWS4_ZFLAG_WHEAD= 0x10    # 单字: 词头
    051    PSCWS4_ZFLAG_WPART= 0x20    # 单字: 词尾或词中
    052    PSCWS4_ZFLAG_ENGLISH=   0x40    # 单字: 夹在中间的英文
    053    PSCWS4_ZFLAG_SYMBOL=    0x80    # 单字: 符号系列
    054
    055    PSCWS4_MAX_EWLEN=       16
    056    PSCWS4_MAX_ZLEN=        128
    057
    058    class PSCWS4(object):
    059        _xd = None # xdb dict handler
    060        _rs = None      # ruleset resource
    061        _rd = None      # ruleset data
    062        _cs = ''    # charset
    063        _ztab = []      # zi len table
    064        _mode = 0   # scws mode
    065        _txt = None     # text string
    066        _res = None
    067        _zis = None     # z if used?(duality)
    068        _off = 0
    069        _len = 0
    070        _wend = 0
    071        _wmap = []
    072        _zmap = []
    073        i = 0
    074
    075        def __init__(self,charset='gbk'):
    076            self._xd = False
    077            self._rs = self._rd = OrderedDict()
    078            self.set_charset(charset)
    079        def __del__(self):
    080            self.close()
    081        def debug(self):
    082            print "off:{0} len(_res):{1} len(_wmap):{2}\
    083    len(_zmap):{3} _wend:{4} _zis:{5}\
    084    len(_rs):{6} len(_rd):{7}\
    085            ".format(\
    086            self._off,len(self._res),len(self._wmap),len(self._zmap),self._wend,self._zis,\
    087            len(self._rs),len(self._rd)
    088            )
    089        #设置字符集(ztab)
    090        def set_charset(self,charset='gbk'):
    091            charset = charset.strip().lower()
    092            if(charset != self._cs):
    093                self._cs = charset
    094                self._ztab = [1 for i in range(0,0x81)]
    095                if(charset == 'utf-8' or charset == 'utf8'):
    096                    self._ztab.extend([1 for i in range(0x81,0xc0)])
    097                    self._ztab.extend([2 for i in range(0xc0,0xe0)])
    098                    self._ztab.extend([3 for i in range(0xe0,0xf0)])
    099                    self._ztab.extend([4 for i in range(0xf0,0xf8)])
    100                    self._ztab.extend([5 for i in range(0xf8,0xfc)])
    101                    self._ztab.extend([6 for i in range(0xfc,0xfe)])
    102                    self._ztab.extend([1])
    103                else:
    104                    self._ztab.extend([2 for i in range(0x81,0xff)])
    105                self._ztab.extend([1])
    106                #print len(self._ztab)
    107            # 设置词典
    108        def set_dict(self,fpath,mem=False):
    109            xdb = XDB_R(mem)
    110            if(xdb.Open(fpath) is not True): return False
    111            self._xd = xdb
    112        #设置规则集
    113        def set_rule(self,fpath):
    114            self._rule_load(fpath)
    115        #设置忽略符号与无用字符
    116        def set_igonre(self,yes):
    117            if(yes is True):self._mode ¦= PSCWS4_IGN_SYMBOL
    118            else: self._mode &= ~PSCWS4_IGN_SYMBOL
    119        #设置复合分词等级 ($level = 0,15)
    120        def set_multi(self,level):
    121            level = (int(level) << 12)
    122            self._mode &= ~PSCWS4_MULTI_MASK
    123            if(level & PSCWS4_MULTI_MASK): self._mode ¦= level
    124        #设置是否显示分词调试信息
    125        def set_debug(self,yes):
    126            if(yes is True): self._mode ¦= PSCWS4_DEBUG
    127            else:self._mode &= ~PSCWS4_DEBUG
    128        #设置是否自动将散字二元化
    129        def set_duality(self,yes):
    130            if(yes is True): self._mode ¦= PSCWS4_DUALITY
    131            else:self._mode &= ~PSCWS4_DUALITY
    132        # 设置要分词的文本字符串
    133        def send_text(self,text):
    134            self._txt = str(text)
    135            self._len = len(self._txt)
    136            self._off =0
    137        # 取回一批分词结果(需要多次调用, 直到返回 false)
    138        def get_result(self):
    139            off = self._off
    140            tlen = self._len
    141            txt = self._txt
    142            self._res = []
    143
    144            while ((off < tlen) and (ord(txt[off])<=0x20)):
    145                if(txt[off] == "\r" or txt[off] == "\n"):
    146                    self._off = off +1
    147                    self._put_res(off,0,1,'un')
    148                    return self._res
    149                off +=1
    150            if(off >= tlen): return False
    151            self._off = off
    152            ch = txt[off]
    153            cx = ord(ch)
    154            if(self._char_token(ch)):
    155                self._off +=1
    156                self._put_res(off,0,1,'un')
    157                return self._res
    158            clen = self._ztab[cx]
    159
    160            zlen = 1
    161            pflag = (PSCWS4_PFLAG_WITH_MB if clen >1 else (PSCWS4_PFLAG_ALNUM if self._is_alnum(cx) else 0))
    162            off = (off + clen)
    163            while off < tlen:
    164                ch = txt[off]
    165                cx = ord(ch)
    166                if (cx <= 0x20 or self._char_token(ch)):break
    167                clen = self._ztab[cx]
    168                if(not (pflag & PSCWS4_PFLAG_WITH_MB)):
    169                    if(clen ==1):
    170                        if((pflag & PSCWS4_PFLAG_ALNUM) and not self._is_alnum(cx)):
    171                            pflag ^= PSCWS4_PFLAG_ALNUM
    172                    else:
    173                        if(not ((pflag & PSCWS4_PFLAG_ALNUM) ) or zlen > 2): break
    174                        pflag ¦= PSCWS4_PFLAG_WITH_MB
    175                elif ( ((pflag & PSCWS4_PFLAG_WITH_MB) ) and clen ==1):
    176                    #mb + single-byte. allowd: alpha+num + 中文
    177                    if(not self._is_alnum(cx)): break
    178                    pflag &= ~PSCWS4_PFLAG_VALID
    179                    i = off+1
    180                    while i<(off+3):
    181                        ch = txt[i]
    182                        cx = ord(ch)
    183                        if( (i >= tlen) or (cx <=0x20) or (self._ztab[cx] > 1)):
    184                            pflag ¦= PSCWS4_PFLAG_VALID
    185                            break
    186                        if(not self._is_alnum(cx)): break
    187                        i+=1
    188                    if( not(pflag & PSCWS4_PFLAG_VALID) ): break
    189                    clen += (i - off -1)
    190                #add max zlen limit
    191                zlen +=1
    192                if(zlen >=PSCWS4_MAX_ZLEN):break
    193                off = (off + clen)
    194
    195            #处理半个字的问题
    196            ch =off
    197            if (ch > tlen):
    198                off -= clen
    199            #do the real segment
    200            if(off <= self._off):
    201                return False
    202            elif ( pflag & PSCWS4_PFLAG_WITH_MB ):
    203                self._msegment(off,zlen)
    204            elif ( not(pflag & PSCWS4_PFLAG_ALNUM) or ((off - self._off) >=PSCWS4_MAX_EWLEN ) ):
    205                self._ssegment(off)
    206            else:
    207                zlen = off -self._off
    208                self._put_res(self._off,2.5*math.log(zlen),zlen,'en')
    209            self._off = (tlen if ch > tlen else off)
    210            if(len(self._res) == 0): return self.get_result()
    211            return self._res
    212        def get_tops(self,limit = 10,xattr = ''):
    213            ret = {}
    214            if(self._txt is None): return False
    215            xmode = False
    216            attrs = {}
    217            if(xattr != ''):
    218                if(xattr[0:1] == '~'):
    219                    xattr = xattr[1:]
    220                    xmode = 1
    221                for tmp in xattr.split(','):
    222                    tmp = tmp.strip().lower()
    223                    if( tmp != ''): attrs[tmp] = True
    224            off = self._off
    225            self._off = cnt = 0
    226            tlist = {}
    227            while 1:
    228                tmpa = self.get_result()
    229                if (not tmpa): break
    230                for tmp in tmpa:
    231                    #有改
    232                    if(tmp['idf'] < 0.2 or tmp['attr'][0:1] == '#'): continue
    233                    if(len(attrs) >0):
    234                        if(xmode == True and not attrs.has_key(tmp['attr'])): continue
    235                        if(xmode == False and attrs.has_key(tmp['attr'])): continue
    236                    word = tmp['word'].lower()
    237                    if(self._rule_checkbit(word,PSCWS4_RULE_NOSTATS)): continue
    238                    if(tlist.has_key(word)):
    239                        tlist[word]['weight'] += tmp['idf']
    240                        tlist[word]['times'] +=1
    241                    else:
    242                        tlist[word] = {'word':tmp['word'],'times':1,'weight':tmp['idf'],'attr':tmp['attr']}
    243            self._off = off
    244            t= sorted(tlist.values(),key=lambda d:d['weight'],cmp=lambda a,b: 1 if b > a else -1)
    245            return t[0:limit]
    246        def close(self):
    247            if(self._xd):
    248                self._xd.Close()
    249                self._xd = False
    250            self._rd = []
    251            self._rs = []
    252        def version(self):
    253            return 'pySCWS/1.0 - by donghongyi'
    254        def _rule_load(self,fpath):
    255            try:
    256                fd = file(fpath,'r')
    257            except IOError:
    258                return False
    259            i = j = 0
    260            self._rs = OrderedDict()
    261            while 1:
    262                buf = fd.readline()
    263                if not buf:
    264                    break
    265                if (buf[0:1] != '['): continue
    266                pos = buf.find(']')
    267                if(pos == -1 or pos ==1 or pos > 15):continue
    268                key = buf[1:pos].lower()
    269                if(self._rs.has_key(key)): continue
    270                item = {'tf':5.0, 'idf':3.5, 'attr':'un', 'bit':0, 'flag':0, 'zmin':0, 'zmax':0, 'inc':0, 'exc':0}
    271                if(key == 'special'):
    272                    item['bit'] = PSCWS4_RULE_SPECIAL
    273                elif (key == 'nostats'):
    274                    item['bit'] = PSCWS4_RULE_NOSTATS
    275                else:
    276                    item['bit'] = (1 << j)
    277                    j +=1
    278                self._rs[key] = item
    279                #这里可能是错误
    280                i +=1
    281                if(i >=PSCWS4_RULE_MAX): break
    282            #load the ruleset
    283            fd.seek(0)
    284            rbl = False
    285            item= {}
    286            while 1:
    287                buf = fd.readline()
    288                if not buf:
    289                    break
    290                ch = buf[0:1]
    291                if(ch == ';'): continue
    292                if(ch == '['):
    293                    item = {}
    294                    pos = buf.find(']')
    295                    if(pos > 1):
    296                        key = buf[1:pos].lower()
    297                        if(self._rs.has_key(key)):
    298                            rbl = True
    299                            item = self._rs[key]
    300                    continue
    301                if(ch == ':'):
    302                    buf = buf[1:]
    303                    pos = buf.find('=')
    304                    if(pos == -1):
    305                        continue
    306                    pkey,pval = buf.split('=',2)
    307                    pkey = pkey.strip()
    308                    pval = pval.strip()
    309                    if(pkey == 'line'):    rbl = False if pval[0:1].strip() == 'n' else True
    310                    elif (pkey =='tf'):    item['tf'] = float(pval)
    311                    elif (pkey =='idf'):    item['idf'] = float(pval)
    312                    elif (pkey =='attr'):    item['attr'] = pval
    313                    elif (pkey == 'znum'):
    314                        pos = pval.find(',')
    315                        if(pos > -1):
    316                            item['zmax'] = int(pval[pos+1:].strip())
    317                            item['flag'] ¦= PSCWS4_ZRULE_RANGE
    318                            pval = pval[0:pos]
    319                        item['zmin'] = int(pval)
    320                    elif (pkey == 'type'):
    321                        if(pval == 'prefix'):
    322                            item['flag'] ¦= PSCWS4_ZRULE_PREFIX
    323                        if(pval == 'suffix'):
    324                            item['flag'] ¦= PSCWS4_ZRULE_SUFFIX
    325                    elif (pkey == 'include' or pkey =='exclude'):
    326                        clude = 0
    327                        for tmp in pval.split(','):
    328                            tmp = tmp.strip().lower()
    329                            if(not self._rs.has_key(tmp)): continue
    330                            clude ¦= self._rs[tmp]['bit']
    331                        if(pkey == 'include'):
    332                            item['inc'] ¦= clude
    333                            item['flag'] ¦= PSCWS4_ZRULE_INCLUDE
    334                        else:
    335                            item['exc'] ¦= clude
    336                            item['flag'] ¦=PSCWS4_ZRULE_EXCLUDE
    337                    continue
    338                if(item == {}): continue
    339                buf = buf.strip()
    340                if (buf == ''): continue
    341                if(rbl):
    342                    self._rd[buf] = item
    343                else:
    344                    tlen = len(buf)
    345                    off =0
    346                    while off < tlen:
    347                        tord = ord(buf[off:off+1])
    348                        zlen = self._ztab[tord]
    349                        if( off + zlen >= tlen): break
    350                        zch = buf[off:off+zlen]
    351                        self._rd[zch] = item
    352                        off += zlen
    353        #get the ruleset
    354        def _rule_get(self,str):
    355            if(not self._rd.has_key(str)): return False
    356            return self._rd[str]
    357        #check the bit with str
    358        def _rule_checkbit(self,str,bit):
    359            if(not self._rd.has_key(str)): return False
    360            bit2 = self._rd[str]['bit']
    361            return (True if (bit & bit2) else False)
    362        #check the rule include ¦ exclude
    363        def _rule_check(self,rule,str):
    364            if( (rule['flag'] & PSCWS4_ZRULE_INCLUDE) and not self._rule_checkbit(str,rule['bit'])): return False
    365            if( (rule['flag'] & PSCWS4_ZRULE_EXCLUDE) and self._rule_checkbit(str,rule['bit'])): return False
    366            return True
    367        #bulid res
    368        def _put_res(self,o,i,l,a):
    369            word = self._txt[o:o+l]
    370            item = {'word':word,'off':o,'idf':i,'len':l,'attr':a}
    371            self._res.append(item)
    372        #alpha, numeric check by ORD value
    373        def _is_alnum(self,c):
    374            return ((c>=48 and c<=57) or (c>=65 and c<=90) or (c>=97 and c<=122))
    375        def _is_alpha(self,c):
    376            return ((c>=65 and c<=90) or ( c>=97 and c<=122))
    377        def _is_ualpha(self,c):
    378            return (c>=65 and c<=90)
    379        def _is_digit(self,c):
    380            return (c>=48 and c<=57)
    381        def _no_rule1(self,f):
    382            return ((f & (PSCWS4_ZFLAG_SYMBOL¦PSCWS4_ZFLAG_ENGLISH)) or ((f & (PSCWS4_ZFLAG_WHEAD¦PSCWS4_ZFLAG_NR2)) == PSCWS4_ZFLAG_WHEAD))
    383        def _no_rule2(self,f):
    384            return self._no_rule1(f)
    385        def _char_token(self,c):
    386            return (c=='('or c==')'or c=='['or c==']'or c=='{'or c=='}'or c==':'or c=='"')
    387        # query the dict
    388        def _dict_query(self,word):
    389            if(not self._xd): return False
    390            value = self._xd.Get(word)
    391            if(not value): return False
    392            tmp = struct.unpack('f f B 3s',value)
    393            return {'tf':tmp[0],'idf':tmp[1],'flag':tmp[2],'attr':tmp[3].rstrip(b'\x00')}
    394        #ssegment, 单字节用语切割
    395        def _ssegment(self,end):
    396            start = self._off
    397            wlen = end - start
    398            #check special words (need strtoupper)
    399            if(wlen > 1):
    400                #可能出错
    401                txt = self._txt[start:start+wlen].lower()
    402                if(self._rule_checkbit(txt,PSCWS4_RULE_SPECIAL)):
    403                    self._put_res(start,9.5,wlen,'nz')
    404                    return
    405            txt = self._txt
    406            #check brief words such as S.H.E M.R.
    407            if( self._is_ualpha(ord(txt[start])) and txt[start+1] == '.'):
    408                #修改
    409                ch = start +2
    410                while ch< end:
    411                    if(not self._is_alpha(ord(txt[ch]))): break
    412                    ch +=1
    413                    if(ch == end or txt[ch] != '.'): break
    414                    ch +=1
    415                if(ch == end):
    416                    self._put_res(start,7.5,wlen,'nz')
    417                    return
    418            #取出单词及标点. 数字允许一个点且下一个为数字,不连续的. 字母允许一个不连续的'
    419            #print 1111
    420            while start < end:
    421                #修改过的
    422                ch = txt[start]
    423                start +=1
    424                cx = ord(ch)
    425                if(self._is_alnum(cx)):
    426                    pflag =PSCWS4_PFLAG_DIGIT if self._is_digit(cx) else 0
    427                    wlen = 1
    428                    while start < end:
    429                        ch = txt[start]
    430                        cx = ord(ch)
    431                        if(pflag & PSCWS4_PFLAG_DIGIT):
    432                            if(not self._is_digit(cx)):
    433                                if( (pflag & PSCWS4_PFLAG_ADDSYM) or cx !=0x2e or not self._is_digit(ord(txt[start+1]))):
    434                                    break
    435                                pflag ¦= PSCWS4_PFLAG_ADDSYM
    436                        else:
    437                            if(not self._is_alpha(cx)):
    438                                if( (pflag & PSCWS4_PFLAG_ADDSYM) or cx !=0x27 or not self._is_alpha(ord(txt[start+1]))):
    439                                    break
    440                                pflag ¦= PSCWS4_PFLAG_ADDSYM
    441                        start +=1
    442                        #可能出错
    443                        wlen +=1
    444                        if(wlen >=PSCWS4_MAX_EWLEN): break
    445                    self._put_res(start-wlen,2.5*math.log(wlen),wlen,'en')
    446                elif (not(self._mode & PSCWS4_IGN_SYMBOL)):
    447                    self._put_res(start-1,0,1,'un')
    448        #get one z by ZMAP
    449        def _get_zs(self,i,j = -1):
    450            if(j == -1): j = i
    451            return self._txt[self._zmap[i]['start']:self._zmap[i]['start']+( self._zmap[j]['end'] - self._zmap[i]['start'])]
    452        #mget_word
    453        def _mget_word(self,i,j):
    454            wmap = self._wmap
    455            if(not (wmap[i][i]['flag'] & PSCWS4_ZFLAG_WHEAD)): return i
    456            r = i
    457            #观察
    458            #k=i+1
    459            for k in range(i+1,j+1):
    460                #while k<=j:
    461                if(wmap[i][k] and wmap[i][k]['flag'] & PSCWS4_WORD_FULL): r =k
    462                #k+=1
    463            return r
    464        #mset_word
    465        def _mset_word(self,i,j):
    466                wmap = self._wmap
    467                zmap = self._zmap
    468                item = wmap[i][j]
    469                if( (item is False) or (( self._mode & PSCWS4_IGN_SYMBOL)\
    470                    and not (item['flag'] & PSCWS4_ZFLAG_ENGLISH) and item['attr'] == 'un' )\
    471                    ):
    472                    return
    473                #散字自动二元聚合
    474                if(self._mode & PSCWS4_DUALITY):
    475                    k = self._zis
    476                    if(i == j and not(item['flag'] & PSCWS4_ZFLAG_ENGLISH) and item['attr'] == 'un'):
    477                        self._zis = i
    478                        if(k < 0): return
    479                        i = (k & ~PSCWS4_ZIS_USED)
    480                        if( (i != (j-1)) or (not (k & PSCWS4_ZIS_USED) and self._wend == i)):
    481                            self._put_res(zmap[i]['start'],wmap[i][i]['idf'],zmap[i]['end'] - zmap[i]['start'],wmap[i][i]['attr'])
    482                            if( i != (j -1)): return
    483                        self._zis ¦= PSCWS4_ZIS_USED
    484                    else:
    485                        if( (k >=0) and (not (k & PSCWS4_ZIS_USED) or ( j > i))):
    486                            k &= ~PSCWS4_ZIS_USED
    487                            self._put_res(zmap[k]['start'], wmap[k][k]['idf'], zmap[k]['end'] - zmap[k]['start'], wmap[k][k]['attr'])
    488                        if( j > i): self._wend = j + 1
    489                        self._zis = -1
    490                #save the res
    491                self._put_res(zmap[i]['start'], item['idf'], zmap[j]['end'] - zmap[i]['start'], item['attr'])
    492                if( (j -i) > 1):
    493                    m = i
    494                    if ( self._mode & PSCWS4_MULTI_SHORT):
    495                        while (m < j):
    496                            k = m
    497                            n = m+1
    498                            while n<=j:
    499                                if(n ==j and m ==i): break
    500                                item = wmap[m][n]
    501                                if(item and item['flag'] & PSCWS4_WORD_FULL):
    502                                    k = n
    503                                    self._put_res(zmap[m]['start'], item['idf'], zmap[n]['end'] - zmap[m]['start'], item['attr'])
    504                                    if (not (item['flag'] & PSCWS4_WORD_PART)): break
    505                                n +=1
    506                            if (k == m):
    507                                if (m == i): break
    508                                item = wmap[m][m]
    509
    510                                self._put_res(zmap[m]['start'], item['idf'], zmap[m]['end'] - zmap[m]['start'], item['attr'])
    511                            m = k+1
    512                            if(m == j):
    513                                m -=1
    514                                break
    515                    if( self._mode & PSCWS4_MULTI_DUALITY):
    516                        while m < j:
    517                            self._put_res(zmap[m]['start'], wmap[m][m]['idf'], zmap[m+1]['end'] - zmap[m]['start'], wmap[m][m]['attr'])
    518                            m +=1
    519                if( (j > i) and (self._mode & (PSCWS4_MULTI_ZMAIN¦PSCWS4_MULTI_ZALL))):
    520                    if( (j -i) == 1 and not wmap[i][j]):
    521                        if(wmap[i][i]['flag'] & PSCWS4_ZFLAG_PUT): i +=1
    522                        else: wmap[i][i]['flag'] ¦= PSCWS4_ZFLAG_PUT
    523                        wmap[j][j]['flag'] ¦= PSCWS4_ZFLAG_PUT
    524                    #这里可能错误
    525                    while i <=j:
    526                        if(wmap[i][i]['flag'] & PSCWS4_ZFLAG_PUT): continue
    527                        ssss = wmap[i][i]['attr'][0:1]
    528                        #print ssss
    529                        if( not (self._mode & PSCWS4_MULTI_ZALL) and not ( ssss[ssss.find('jnv'):])): continue
    530                        self._put_res(zmap[i]['start'], wmap[i][i]['idf'], zmap[i]['end'] - zmap[i]['start'], wmap[i][i]['attr'])
    531                        i +=1
    532        #mseg_zone
    533        def _mseg_zone(self,f,t):
    534            weight = nweight = 0.0
    535            wmap = self._wmap
    536            zmap = self._zmap
    537            mpath = npath = []
    538            x = f
    539            for i in range(f,t+1):
    540                j = self._mget_word(i,t)
    541                if ( j == i or j <=x or ( wmap[i][j]['flag'] & PSCWS4_WORD_USED)): continue
    542                #one word only
    543                if (i ==f and j ==t):
    544                    mpath = [(j-i),0xff]
    545                    break
    546                if( i !=f and (wmap[i][j]['flag'] & PSCWS4_WORD_RULE)): continue
    547                #create the new path
    548                wmap[i][j]['flag'] ¦= PSCWS4_WORD_USED
    549                nweight = wmap[i][j]['tf'] * (j-i+1)
    550
    551                if (i ==f): nweight *=1.2
    552                elif (j ==t): nweight *=1.4
    553                if(npath == []):
    554                    npath = [0xff for uuu in range(t-f+2)]
    555
    556                #lookfor backward
    557                x = 0
    558                m = f
    559                while m< i:
    560                    n = self._mget_word(m,i-1)
    561                    nweight *= wmap[m][n]['tf'] * (n-m+1)
    562                    npath[x] = n-m
    563                    x +=1
    564                    if(n>m): wmap[m][n]['flag'] ¦= PSCWS4_WORD_USED
    565                    m = n+1
    566                #my self
    567                npath[x] = j-i
    568                x+=1
    569                #lookfor forward
    570                m = j+1
    571                while m <=t:
    572                    n = self._mget_word(m,t)
    573                    nweight *= wmap[m][n]['tf'] * (n-m+1)
    574                    npath[x] = n-m
    575                    x +=1
    576                    if(n >m): wmap[m][n]['flag'] ¦= PSCWS4_WORD_USED
    577                    m = n+1
    578                npath[x] = 0xff
    579                nweight /= pow(x-1,4)
    580                #draw the path for debug
    581                if(self._mode & PSCWS4_DEBUG):
    582                    print "PATH by keyword = {0} (weight={1}):\n".format(self._get_zs(i,j),nweight)
    583                    m=f
    584                    x=0
    585                    n = npath[x]
    586                    while n !=0xff:
    587                        n +=m
    588                        print self._get_zs(m,n),' '
    589                        m = n+1
    590                        x+=1
    591                        n = npath[x]
    592                    print "\n--\n"
    593                x = j
    594                #check better path
    595                if(nweight > weight):
    596                    weight = copy.deepcopy(nweight)
    597                    swap = copy.deepcopy(mpath)
    598                    mpath = copy.deepcopy(npath)
    599                    npath = copy.deepcopy(swap)
    600                    del swap
    601            #set the result, mpath != NULL
    602            if(mpath == []): return
    603            m = f
    604            x=0
    605            n = mpath[x]
    606            #print mpath
    607            while n !=0xff:
    608                n +=m
    609                #print m,n
    610                self._mset_word(m,n)
    611                m = n +1
    612                x+=1
    613                n = mpath[x]
    614        #msegment(重点函数)
    615        def _msegment(self,end,zlen):
    616            self._wmap = [[False for ooooo in range(zlen)] for i in range(zlen)]
    617            self._zmap = [False for ooooo in range(zlen)]
    618            wmap = self._wmap
    619            zmap = self._zmap
    620            txt = self._txt
    621            start = self._off
    622            self._zis = -1
    623            #load the zmap
    624            i =0
    625            #load the zmap
    626            while start < end:
    627                ch = txt[start]
    628                cx = ord(ch)
    629                clen = self._ztab[cx]
    630                if(clen == 1):
    631                    while start < end:
    632                        start +=1 #修改
    633                        cx = ord(txt[start])
    634                        if(self._ztab[cx] > 1): break
    635                        clen +=1
    636                    wmap[i][i] = {'tf':0.5, 'idf':0, 'flag':PSCWS4_ZFLAG_ENGLISH, 'attr':'un'}
    637                else:
    638                    query = self._dict_query(txt[start:start+clen])
    639                    if(not query):
    640                        wmap[i][i] = {'tf':0.5, 'idf':0, 'flag':0, 'attr':'un'}
    641                    else:
    642                        if(query['attr'][0:1] == '#'): query['flag'] ¦= PSCWS4_ZFLAG_SYMBOL
    643                        wmap[i][i] = query
    644                    start += clen
    645                zmap[i] = {'start':start-clen, 'end':start}
    646                i+=1
    647
    648            #fixed real zlength
    649            zlen = i
    650            #create word query table
    651            for i in range(zlen):
    652                k=0
    653                j = i +1
    654                while j<zlen:
    655                    query = self._dict_query(self._get_zs(i,j))
    656                    if (not query):break
    657                    ch = query['flag']
    658                    if(ch & PSCWS4_WORD_FULL):
    659                        wmap[i][j] = query
    660                        wmap[i][i]['flag'] ¦= PSCWS4_ZFLAG_WHEAD
    661                        k = i+1
    662                        while k<=j:
    663                            wmap[k][k]['flag'] ¦= PSCWS4_ZFLAG_WPART
    664                            k+=1
    665                    if (not (ch & PSCWS4_WORD_PART)): break
    666                    j +=1
    667                k-=1
    668                if(k and k>=0):
    669                    #set nr2 to some short name
    670                    if(k == (i+1)):
    671                        if(wmap[i][k]['attr'] == 'nr'):
    672                            wmap[i][i]['flag'] ¦= PSCWS4_ZFLAG_NR2
    673                    #clean the PART flag for the last word
    674                    if(k < j):
    675                        wmap[i][k]['flag'] ^= PSCWS4_WORD_PART
    676            # try to do the ruleset match
    677            # for name & zone & chinese numeric
    678            if(len(self._rd) > 0):
    679                #check for 'one word'
    680                for i in range(zlen):
    681                    if(self._no_rule1(wmap[i][i]['flag'])): continue
    682                    r1 = self._rule_get(self._get_zs(i))
    683                    if(not r1): continue
    684                    clen = r1['zmin'] if r1['zmin'] >0 else 1
    685                    if(( r1['flag'] & PSCWS4_ZRULE_PREFIX) and (i < (zlen-clen))):
    686                        #先检查 zmin 字内是否全部符合要求, 再在 zmax 范围内取得符合要求的字
    687                        ch =1
    688                        while ch <=clen:
    689                            j = i + ch
    690                            if(j >= zlen or self._no_rule2(wmap[j][j]['flag'])):break
    691                            if(not self._rule_check(r1,self._get_zs(j))): break
    692                            ch+=1
    693                        if(ch <= clen): continue
    694                        #no limit znum or limit to a range
    695                        j = i +ch
    696                        while 1:
    697                            if( (not r1['zmax'] and r1['zmin']) or (r1['zmax'] and (clen >= r1['zmax']))): break
    698                            if(j >= zlen or self._no_rule2(wmap[j][j]['flag'])): break
    699                            if( not self._rule_check(r1,self._get_zs(j))): break
    700                            clen +=1
    701                            j +=1
    702                        # 注意原来2字人名,识别后仍为2字的情况
    703                        if(wmap[i][i]['flag'] & PSCWS4_ZFLAG_NR2):
    704                            if(clen ==1): continue
    705                            wmap[i][i+1]['flag'] ¦= PSCWS4_WORD_PART
    706                        #ok, got: i & clen
    707                        k = i + clen
    708                        wmap[i][k] = {'tf':r1['tf'], 'idf':r1['idf'], 'flag':(PSCWS4_WORD_RULE¦PSCWS4_WORD_FULL), 'attr':r1['attr']}
    709                        wmap[i][i]['flag'] ¦= PSCWS4_ZFLAG_WHEAD
    710
    711                        j = i+1
    712                        while j<=k:
    713                            wmap[j][j]['flag'] ¦= PSCWS4_ZFLAG_WPART
    714                            j+=1
    715                        if(not (wmap[i][i]['flag'] & PSCWS4_ZFLAG_WPART)): i =k
    716                        continue
    717                    if( (r1['flag'] & PSCWS4_ZRULE_SUFFIX) and (i >= clen)):
    718                        #suffix, check before
    719                        ch = 1
    720                        while ch<=clen:
    721                            j = i -ch
    722                            if(j < 0 or self._no_rule1(wmap[j][j]['flag'])): break
    723                            if(not self._rule_check(r1, self._get_zs(j))):break
    724                            ch+=1
    725                        if (ch <= clen): continue
    726                        #no limit znum or limit to a range
    727                        j = i - ch
    728                        while 1:
    729                            if( (not r1['zmax'] and r1['zmin']) or (r1['zmax'] and (clen >= r1['zmax']))): break
    730                            if( j < 0 or self._no_rule2(wmap[j][j]['flag'])): break
    731                            if( not self._rule_check(r1,self._get_zs(j))): break
    732                            clen +=1
    733                            j -=1
    734                        #ok, got: i & clen (maybe clen=1 & [k][i] isset)
    735                        k = i -clen
    736                        if(wmap[k][i] is not False): continue
    737                        wmap[k][i] = {'tf':r1['tf'], 'idf':r1['idf'], 'flag':PSCWS4_WORD_FULL, 'attr':r1['attr']}
    738                        wmap[k][k]['flag'] ¦= PSCWS4_ZFLAG_WHEAD
    739                        j = k+1
    740                        while j <=i:
    741                            wmap[j][j]['flag'] ¦= PSCWS4_ZFLAG_WPART
    742                            if( (j != i) and (wmap[k][i] is not False) ): wmap[k][j]['flag'] ¦= PSCWS4_WORD_PART
    743                            j+=1
    744                        continue
    745                #check for 'two words' (such as: 欧阳** , **西路)
    746                #print wmap[6]
    747                for i in range(zlen-2,-1,-1):
    748                    #with value ==> must be have SCWS_WORD_FULL, so needn't check it ag.
    749                    if( (wmap[i][i+1] is False) or wmap[i][i+1]['flag'] & PSCWS4_WORD_PART): continue
    750                    k = i +1
    751                    #print k
    752                    r1= self._rule_get(self._get_zs(i,k))
    753                    if(not r1): continue
    754                    clen =r1['zmin'] if r1['zmin'] else 1
    755                    if( (r1['flag'] & PSCWS4_ZRULE_PREFIX) and (k < (zlen-clen))):
    756                        ch = 1
    757                        while ch<=clen:
    758                            j = k +ch
    759                            if(j >= zlen or self._no_rule2(wmap[j][j]['flag'])): break
    760                            if(not self._rule_check(r1,self._get_zs(j))): break
    761                            ch +=1
    762                        if(ch <= clen):continue
    763                        #no limit znum or limit to a range
    764                        j = k+ch
    765                        while 1:
    766                            if( (not r1['zmax'] and r1['zmin']) or (r1['zmax'] and (clen >=r1['zmax']))): break
    767                            if(j >= zlen or self._no_rule2(wmap[j][j]['flag'])): break
    768                            if(not self._rule_check(r1,self._get_zs(j))): break
    769                            clen +=1
    770                            j +=1
    771                        #ok, got: i & clen
    772                        k = k + clen
    773                        wmap[i][k] = {'tf':r1['tf'], 'idf':r1['idf'], 'flag':PSCWS4_WORD_FULL, 'attr':r1['attr']}
    774                        wmap[i][i+1]['flag'] ¦= PSCWS4_WORD_PART
    775                        j=i+2
    776                        while j<=k:
    777                            wmap[j][j]['flag'] ¦= PSCWS4_ZFLAG_WPART
    778                            j+=1
    779                        i -=1
    780                        continue
    781                    if ( (r1['flag'] & PSCWS4_ZRULE_SUFFIX) and (i >= clen)):
    782                        # suffix, check before
    783                        ch = 1
    784                        while ch<=clen:
    785                            j = i -ch
    786                            if(j < 0 or self._no_rule1(wmap[j][j]['flag'])): break
    787                            if ( not self._rule_check(r1,self._get_zs(j))): break
    788                            ch +=1
    789                        if (ch <= clen): continue
    790                        #no limit znum or limit to a range
    791                        j = i - ch
    792                        while 1:
    793                            if( (not r1['zmax'] and r1['zmin']) or (r1['zmax'] and (clen >= r1['zmax'])) ): break
    794                            if(j < 0 or self._no_rule2(wmap[j][j]['flag'])): break
    795                            if( not self._rule_check(r1,self._get_zs(j))): break
    796                            clen +=1
    797                            j -=1
    798                        #ok, got: i & clen (maybe clen=1 & [k][i] isset)
    799                        k = i - clen
    800                        i = i +1
    801                        wmap[k][i] = {'tf':r1['tf'], 'idf':r1['idf'], 'flag':PSCWS4_WORD_FULL, 'attr':r1['attr']}
    802                        wmap[k][k]['flag'] ¦= PSCWS4_ZFLAG_WHEAD
    803                        j = k+1
    804                        while j<=i:
    805                            wmap[j][j]['flag'] ¦= PSCWS4_ZFLAG_WPART
    806                            if(wmap[k][j] is not False): wmap[k][j]['flag'] ¦= PSCWS4_WORD_PART
    807                            j+=1
    808                        i -= (clen +1)
    809                        continue
    810            # do the segment really
    811            # find the easy break point
    812
    813            j=0
    814            i=0
    815            for i in range(zlen):
    816                if(wmap[i][i]['flag'] & PSCWS4_ZFLAG_WPART): continue
    817                if(i > j):
    818                    self._mseg_zone(j,i-1)
    819                j = i
    820                if (not (wmap[i][i]['flag'] & PSCWS4_ZFLAG_WHEAD)):
    821                    self._mset_word(i,i)
    822                    j+=1
    823            i+=1
    824            #错在这里
    825            #the lastest zone
    826            if(i > j):
    827                self._mseg_zone(j,i-1)
    828            if( (self._mode & PSCWS4_DUALITY) and (self._zis >=0) and not (self._zis & PSCWS4_ZIS_USED) ):
    829                i = self._zis
    830                self._put_res(zmap[i]['start'],wmap[i][i]['idf'],zmap[i]['end'] - zmap[i]['start'],wmap[i][i]['attr'])
    831
    832    def test(text):
    833            st = time.time()
    834            text = text
    835            for i in range(100):
    836                cws.send_text(text)
    837                while cws.get_result():
    838                    pass
    839
    840            ret = cws.get_tops(10,'r,v,p')
    841            print "No.\tWord\t\t\tAttr\tTimes\tRank\n------------------------------------------------------\n"
    842            i = 0
    843            for tmp in ret:
    844                i+=1
    845                print "%02d.\t%-8s\t%s\t%d\t%.2f" %( i, tmp['word'].decode('gbk'),tmp['attr'], tmp['times'], tmp['weight'])
    846
    847            print u'所花时间：',time.time()-st
    848    if __name__=='__main__':
    849        cws = PSCWS4('gbk')
    850        cws.set_dict('dict.xdb',True)
    851        cws.set_rule('rules.ini')
    852        cws.send_text("""中国航天官员应邀到美国与太空总署官员开会发展中国家上海大学城书店表面的东西今天我买了一辆面的，于是我坐着面的去上班化妆和服装这个门把手坏了，请把手拿开将军任命了一名中将，产量三年中将增长两倍王军虎去广州了，王军虎头虎脑的欧阳明练功很厉害可是马明练不厉害北京华烟云人中出吕布马中出赤兔Q1,中我要买Q币充值""")
    853        cws.set_igonre(False) #设置忽略符号与无用字符
    854        #cws.set_debug(True) #设置是否显示分词调试信息
    855        cws.set_multi(3) #设置复合分词等级 ($level = 0,15)
    856        cws.set_duality(True) #设置是否自动将散字二元化
    857        #test("中国航天官员应邀到美国与太空总署官员开会发展中国家上海大学城书店表面的东西今天我买了一辆面的，于是我坐着面的去上班化妆和服装这个门把手坏了，请把手拿开将军任命了一名中将，产量三年中将增长两倍王军虎去广州了，王军虎头虎脑的欧阳明练功很厉害可是马明练不厉害京华烟云人中出吕布马中出赤兔Q1,中我要买Q币充值")
    858
    859    while 1:
    860        tmp = cws.get_result()
    861        if(not tmp):break
    862        line = ''
    863        for w in tmp:
    864            if (w['word'] == "\r"): continue
    865            if (w['word'] == "\n"):
    866                line = line.rstrip(' ') + "\n"
    867            #else: line .= w['word'] . "/{w['attr']} "
    868            else: line += w['word'] + " "
    869        print line
    870    #t = '，'
    871    #print len(t[0:2])
    872    #print ord(t[1])
    873
    874    #    ret = cws.get_tops(10,'r,v,p')
    875
    876    #    print "No.\tWord\t\t\tAttr\tTimes\tRank\n------------------------------------------------------\n"
    877    #    i = 0
    878    #    for tmp in ret:
    879    #        i+=1
    880    #       print "%02d.\t%-8s\t%s\t%d\t%.2f" %( i, tmp['word'].decode('gbk'),tmp['attr'], tmp['times'], tmp['weight'])

    xdb_r.py文件源码：
    view source
    001    #coding=gbk
    002    import os
    003    import struct
    004    import sys
    005    reload(sys)
    006    sys.setdefaultencoding('gbk')
    007    XDB_VERSION = 34 # 0x01 ~ 0xff
    008    XDB_TAGNAME = 'XDB' # First bytes
    009    XDB_MAXKLEN = 0xf0 # maxklen: < 255
    010
    011    class XDB_R(object):
    012        fd = False
    013        hash_base = 0
    014        hash_prime = 0
    015        memread = None #内存
    016        mem = False #是否启用内存
    017        off = 0 #位置
    018        len = 0 #内存长度
    019        def __init__(self,mem=False):
    020            self.mem = mem
    021            pass
    022        def __del__(self):
    023            self.Close()
    024            pass
    025        def Open(self,fpath):
    026            self.Close()
    027            try:
    028                fd = file(fpath,'rb')
    029            except IOError:
    030                raise Exception('XDB::Open("' + os.path.basename(fpath) + '"),invalid xdb failed.')
    031            else:
    032                if(self.mem):
    033                    self.memread = fd.read()
    034                    self.len = len(self.memread)
    035                self.fd = fd
    036            if( self._check_header(fd) is False):
    037                raise Exception('XDB::Open("' + os.path.basename(fpath) + '"),invalid xdb format.')
    038                fd.close()
    039            return True
    040        def _read(self,size):
    041            if(self.mem):
    042                return self.memread[self.off:self.off+size]
    043            else:
    044                return self.fd.read(size)
    045        def _seek(self,seek,flag=False):
    046            if(self.mem):
    047                if self.off > self.len: raise Exception('Mem offset !')
    048                self.off = seek
    049            else:
    050                self.fd.seek(seek,flag)
    051        def _close(self):
    052            if(self.mem):
    053                self.memread = None
    054            else:
    055                self.fd.close()
    056            self.fd = False
    057        def Get(self,key):
    058            if(self.fd is False):
    059                raise Exception('XDB:Get(), null db handler.')
    060            klen = len(key)
    061            #print klen
    062            if(klen ==0 or klen > XDB_MAXKLEN):
    063                return False
    064            rec = self._get_record(key)
    065            if(not rec.has_key('vlen') or rec['vlen'] ==0):
    066                return False
    067
    068            return rec['value']
    069        def Close(self):
    070            if(self.fd is False):
    071                return
    072            self._close()
    073        def _get_index(self,key):
    074            l = len(key)
    075            h = self.hash_base
    076            while l:
    077                l-=1
    078                h += (h << 5)
    079                h ^= ord(key[l])
    080                h &= 0x7fffffff
    081            return (h % self.hash_prime)
    082        def _check_header(self,fd):
    083            fd.seek(0,os.SEEK_SET)
    084            buf = fd.read(32)
    085            if(len(buf) != 32): return False
    086            unpack = struct.unpack('3s B I I I f 12s',buf)
    087            if(len(unpack) <=6):
    088                unpack = list(unpack)
    089                unpack.extend(' ')
    090            hdr = {}
    091            hdr['tag'],hdr['ver'],hdr['base'],hdr['prime'],hdr['fsize'],hdr['check'],hdr['reversed'] =unpack[0],unpack[1],unpack[2],unpack[3],unpack[4],unpack[5],unpack[6]
    092            if(hdr['tag'] != XDB_TAGNAME): return False
    093            fstat = os.fstat(fd.fileno())
    094            if(fstat.st_size != hdr['fsize']): return False
    095            self.hash_base = hdr['base']
    096            self.hash_prime = hdr['prime']
    097            self.version = hdr['ver']
    098            self.fsize = hdr['fsize']
    099        def _get_record(self,key):
    100            self._io_times = 1
    101            index = self._get_index(key) if self.hash_prime > 1 else 0
    102            poff = index * 8 + 32
    103            self._seek(poff,os.SEEK_SET)
    104            buf = self._read(8)
    105
    106            if(len(buf) ==8):
    107                tmp = struct.unpack('I I',buf)
    108                tmp = {'off':tmp[0],'len':tmp[1]}
    109            else:tmp = {'off':0,'len':0}
    110            return self._tree_get_record(tmp['off'],tmp['len'],poff,key)
    111
    112        def _tree_get_record(self,off,len,poff =0,key =''):
    113            if(len == 0): return {'poff':poff}
    114            self._io_times+=1
    115            self._seek(off,os.SEEK_SET)
    116            rlen = XDB_MAXKLEN + 17
    117
    118            if(rlen > len): rlen = len
    119            buf = self._read(rlen)
    120            unpack = struct.unpack('I I I I B',buf[0:17])
    121            rec = {}
    122            rec['loff'],rec['llen'],rec['roff'],rec['rlen'],rec['klen'] = unpack[0],unpack[1],unpack[2],unpack[3],unpack[4]
    123
    124            fkey = buf[17:17+rec['klen']]
    125            cmpl = cmp(key,fkey) if(key) else 0
    126            #print key.decode('gbk'),fkey.decode('gbk')
    127            if(cmpl > 0):
    128                buf =''
    129                return self._tree_get_record(rec['roff'],rec['rlen'],off+8,key)
    130            elif (cmpl < 0):
    131                buf=''
    132                return self._tree_get_record(rec['loff'],rec['llen'],off,key)
    133            else:
    134                rec['poff'] = poff
    135                rec['off'] = off
    136                rec['len'] = len
    137                rec['voff'] = off + 17 + rec['klen']
    138                rec['vlen'] = len - 17 - rec['klen']
    139                rec['key'] = fkey
    140                self._seek(rec['voff'],os.SEEK_SET)
    141                rec['value'] = self._read(rec['vlen'])
    142                return rec
    143    #
    144
    145    #aa = XDB_R(True)
    146    #aa.Open('./dict.xdb')
    147    #aab = aa.Get('上海')
    148    #print aab

你可能感兴趣的:(python)

AIGC与教育行业的邂逅--其在数学领域的应用与实现想成为高手499 AIGC
引言在数学教学中，教师往往需要大量的时间准备练习题和答案解析，而学生则需要定制化的练习来满足不同的学习需求。AIGC技术可以通过自动生成数学题目、定制化学习内容、即时反馈等方式，极大地提升数学学习的效率与质量。本文将深入探讨AIGC在数学领域的几种应用场景，并通过Python代码展示具体实现方式。1.自动生成数学题目与解析数学题目生成是AIGC在数学教学中的主要应用之一。通过生成不同难度和类型的题
Python在人工智能与机器人开发中的应用与实践一键难忘 python 人工智能机器人
Python在人工智能与机器人开发中的应用与实践Python已经成为人工智能和机器人开发的主要编程语言之一，凭借其简洁的语法、强大的库支持和广泛的社区资源，Python为开发者提供了一个高效且易于学习的平台。在这篇文章中，我们将深入探讨如何使用Python进行人工智能（AI）和机器人开发，并通过实际代码示例展示核心技术和应用。1.Python在人工智能中的应用人工智能（AI）领域的核心任务包括机器
python中strip()，lstrip()，rstrip()函数的讲解使用方法高质量海王哦 python python
在Python中，strip()、lstrip()和rstrip()是用于处理字符串的三个常用方法，它们的作用都是去除字符串两端的空白字符或指定字符，但它们的去除位置有所不同。下面是它们的详细讲解：1.strip()方法strip()方法用于去除字符串两端的空白字符（默认情况下，包括空格、换行符、制表符等），或者去除指定的字符序列。语法：string.strip([chars])chars：可选参
疯狂python讲义学习日志06——异常处理静笃归心方得平和心气 Python学习日志异常处理 python学习 python笔记 python速成
疯狂python讲义学习日志06——异常处理引言1异常处理机制1.1使用try...except处理异常1.2异常类的继承体系1.3多异常捕获1.4访问异常信息1.5else块1.6使用finally回收资源2使用raise处理异常2.1引发异常2.2自定义异常类2.3except和raise同时使用3.python的异常传播轨迹4.异常处理规则4.1不要过度使用异常4.2不要忽略异常引言异常机制
Python 生成数据(使用Pygal模拟掷骰子) 钢铁男儿 Python 从入门到精通 python 开发语言
数据可视化指的是通过可视化表示来探索数据，它与数据挖掘紧密相关，而数据挖掘指的是使用代码来探索数据集的规律和关联。数据集可以是用一行代码就能表示的小型数字列表，也可以是数以吉字节的数据。使用Pygal模拟掷骰子在本节中，我们将使用Python可视化包Pygal来生成可缩放的矢量图形文件。对于需要在尺寸不同的屏幕上显示的图表，这很有用，因为它们将自动缩放，以适合观看者的屏幕。如果你打算以在线方式使用
计算机专业毕业设计题目推荐（新颖选题）本科计算机科学专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计计算机网络毕设选题毕设系统毕设题目计算机科学专业
文章目录前言最新毕设选题（建议收藏起来）本科计算机科学专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能设计
Python中 rstrip()、 lstrip（）、 strip() 的用法和区别一只小小的土拨鼠深度学习面试前端 java python 深度学习
目录：题目一：Python中rstrip()、lstrip（）、strip()的用法和区别题目二：python中append（）、expend（）函数的用法和区别题目三：Python中zip()、zip(*zipped)、*zip()函数的用法和区别题目一：Python中rstrip()、lstrip（）、strip()的用法和区别考点这三个函数都是去除头尾字符、空白符的函数strip：用来去除头
Python个人学习笔记（17）：模块（sys、pickle&json） NEET_LH 樵夫老师Python零基础课程个人学习笔记 python 学习笔记
五、sys模块sys.exit()：退出while1:print(123)sys.exit(0)#程序退出，0是正常退出，1是非正常退出，记录在日志中sys.version：得到当前解释器的运行环境sys.platform：运行平台，win32=windows代码：print(sys.version)print(sys.platform)结果：3.13.0(tags/v3.13.0:60403a5
python学习笔记之异常（内置标准异常总结） Molly_DD Python学习笔记 python 软件测试
python异常处理机制异常处理是python的一种高级工具，当异常发生时，程序会停止当前的所有工作，跳转到异常处理部分去执行。异常既可以是程序错误引发的，也可以由代码主动触发。异常处理基本结构try:可能引发异常的代码except异常类型名称：异常处理代码else：没有发生异常时执行的代码异常报错：try：classtest:defgetdata(self):returnself.datay=t
python strip/rstrip/lstrip详细讲解（涵盖许多例子、作用以及复杂行为处理） zilan23 Python python
pythonstrip/rstrip/lstrip详细讲解：在Python中，strip、lstrip、rstrip是用于字符串处理的常用方法，主要功能是去除字符串首尾的指定字符。它们的区别如下：1.strip([chars])作用：删除字符串开头和结尾处所有属于chars的字符，直到遇到不属于chars的字符为止。默认行为：若未提供chars参数，默认去除空白符（空格、换行\n、制表符\t等）。
Python逆向爬取Tik Tok，MsToken,X-Bogus以及signature 才华是浅浅的耐心 python javascript 前端
自5月起，抖音正式开放Web接口，并不断升级风控机制。从最初的_signature参数，到增加滑块验证，再到如今的JSVM混淆处理，以及mstoken和x-bougs等参数的引入。分析发现，部分国内接口仅需提供Cookie即可访问，无需额外验签，而获取Cookie的方式多种多样，其中利用OpenCV识别滑块验证码是一种简单可行的方法。相比之下，TikTok的接口无需Cookie，但对签名的校验更加
Browser-Use WebUI项目启动指南思考在马桶上人工智能 chatgpt 经验分享 python
摘要此前发布《Browser-UseWebUI使用体验》博文后，鉴于部分朋友运行时出现问题，重新运行并整理相关内容。本文详细记录WebUI项目启动全过程，涵盖Python3.11+、Chrome浏览器及APIKeys等环境要求，Python环境检查、依赖安装等环境配置步骤，.env文件中环境变量的设置方法。同时，针对启动中如lxml.html.clean依赖缺失、连接被拒等问题给出解决方案，介绍启
Linux篇1-初识Linux 逃跑的机械工 Linux linux
1.Linux能干什么Linux能够进行各种语言的开发工作，基本主要以后端语言为主C++，JAVA,python;Linux能进行各种指令操作，从而完成各种的文件相关的管理工作2.Linux基本指令2.1ls指令在Linux中，以.开头的文件，叫做隐藏文件；ls-a显示隐藏文件隐藏文件：Linux配置文件，可以隐藏起来，防止误操作，起到保护作用；ls-l列出文件的详细信息-d将目录象文件一样显示，
Python获取tiktok视频数据信息 api 爬虫程序媛了了 python 开发语言
Tiktok通过ID爬取视频信息api采集页面如图：https://www.tiktok.com/@basketwithball2.0/video/7273119444522650912?q=irving&t=1706683319923请求APIhttp://api.xxxx.com/tt/video/info?video_id=7273119444522650912&token=test请求参数
【初学者】用Python语言来解释指针的用例与应用场景 lisw05 python python 开发语言
李升伟整理Python本身并不直接支持指针的概念，因为Python是一种高级语言，内存管理由解释器自动处理。不过，Python提供了一些机制（如引用、可变对象等）来实现类似指针的功能。以下是Python中“指针”的用例和应用场景。1.引用机制（类似指针）在Python中，变量是对对象的引用，而不是直接存储对象的值。这种引用机制类似于指针的概念。示例：a=10#a是对整数对象10的引用b=a#b也引
python、JavaScript 、JAVA等实例代码演示教你如何免费获取股票数据（实时数据、历史数据、CDMA、KDJ等指标数据）配有股票数据API接口说明文档详解参数说明蝶澈乐乐 python javascript java 股票数据接口 api 开发语言
近一两年来，股票量化分析逐渐受到广泛关注。而作为这一领域的初学者，首先需要面对的挑战就是如何获取全面且准确的股票数据。因为无论是实时交易数据、历史交易记录、财务数据还是基本面信息，这些数据都是我们进行量化分析时不可或缺的宝贵资源。我们的核心任务是从这些数据中挖掘出有价值的信息，为我们的投资策略提供有力的支持。在寻找数据的过程中，我尝试了多种途径，包括自编网易股票页面爬虫、申万行业数据爬虫，以及同花
31天Python入门——第7天:集合·字典你真的懂了吗? 安然无虞 Python手把手教程 python 开发语言后端
你好，我是安然无虞。文章目录1.集合1.1集合的定义1.2集合的常用操作1.3集合练习2.字典2.1字典的定义2.2嵌套字典和字典的取值2.3字典的常用操作补充知识:字典的优势是查找值效率高2.4字典推导式2.5字典练习很重要的补充练习:希望你能掌握练习一练习二1.集合在之前的章节中,我们学习了列表,元组,字符串.已经可以覆盖七成的使用场景了.那么为什么还要学习集合类型呢.列表:有序可变,元素可重
打造城市二手房分析与可视化系统+聚类分析+58爬虫+线性回归 OverlordDuke 聚类算法数据可视化爬虫线性回归算法
打造城市二手房分析与可视化系统+聚类分析+58爬虫+线性回归利用数据实现全面分析数据分析与可视化功能创新的聚类分析功能结语在如今房地产市场日益复杂的背景下，对于投资者、购房者和市场分析师来说，了解市场动态并做出明智的决策至关重要。基于此，我们开发了一款基于Python的城市二手房分析与可视化系统，为用户提供了强大的工具，帮助他们深入了解当地房地产市场。利用数据实现全面分析我们的系统利用爬取的58同
centos7输入python -m bitsandbytes报错CUDA Setup failed despite GPU being available. Please run the follo 小太阳，乐向上 python 开发语言
在centos7.9系统中安装gpu驱动及cuda，跑大模型会报错，提示让输入python-mbitsandbytes依然报错：CUDASETUP:Loadingbinary/usr/local/python3/lib/python3.9/site-packages/bitsandbytes/libbitsandbytes_cuda117.so.../lib64/libstdc++.so.6:ve
Linux安装Anaconda和Jupyter 硬水果糖人工智能 Linux linux jupyter 运维
一、了解Anaconda和Jupyter引言：Anaconda是一个流行的开源数据科学平台，广泛用于数据分析、机器学习、人工智能等领域。它是一个集成了大量科学计算和数据科学工具的Python和R编程语言环境。Anaconda的主要目标是简化数据科学和机器学习的开发流程，提供一个易于安装和管理的环境。而预装了大量常用的Python和R库，这些库涵盖了数据科学的各个方面，包括：数据分析：Pandas、
python-56-基于Vue和Flask进行前后端分离的项目开发示例实战皮皮冰燃 python3 python vue.js flask
文章目录1创建Vue前端项目1.1运行demo1.2实现需求2flask部署上述dist(前后端未分离)2.1代码app.py2.2运行访问3nginx部署(前后端分离)3.1nginx前端服务3.3.1windows安装nginx3.3.2修改nginx.conf配置文件3.3.3启动nginx3.3.3停止nginx3.2启动后端服务3.2.1app.py(去除前端渲染)3.2.2启动flas
爬虫基础--request库详解 amo的代码园_毕设 Java基础爬虫 java spring boot vue.js python 开发语言
爬虫基础–request库详解1.requests模块介绍request库中文文档：https://docs.python-requests.org/zh_CN/latest/user/quickstart.htmlrequests是一个非常流行的PythonHTTP第三方库，它允许你发送各种HTTP请求，处理cookies、会话、连接池、重定向、多种认证方式等，使得处理HTTP请求变得非常便捷，
基于百度翻译的python爬虫示例魂万劫 python 爬虫开发语言百度翻译
(今年java工作真难找啊，有广州java高级岗位招人的好心人麻烦推一下，拜谢。。）花了一周时间，从零基础开始学习了python，学有所获之后，就总想爬些什么，不然感觉不得劲，所以花了一天时间整出了个百度翻译的爬虫示例，主要卡点花在了找token、sign以及调试请求上。代码有点乱，毕竟是demo，但是功能是实现了的。importrequestsimportjs2pyimportrefromurl
关于bitsandbytes安装报错跃跃欲试88 语言模型人工智能 transformer
RunTimeError:CUDASetupfaileddespiteGPUbeingavailable.InspecttheCUDASETUPoutputsabovetofixyourenvironment!ubuntu@VM-0-8-ubuntu:~$python-mbitsandbytesFalse===================================BUGREPORT===
ChatGPT、DeepSeek、GIS与Python机器学习强强联合！地质灾害风险评估、易发性分析、信息化建库及灾后重建 WangYan2022 DeepSeek ChatGPT 地下水地质灾害 DeepSeek ChatGPT GIS 灾后重建
在地质灾害频繁肆虐的当下，精准开展风险评价刻不容缓。如今，一门极具创新性的教程震撼登场，它将ChatGPT、DeepSeek等前沿技术与GIS、Python以及机器学习深度交融，为学员打造出前所未有的学习体验，助力大家在地质灾害风险评价领域强势突围，一路领先。前沿技术融合，铸就智能学习核心动力教程最闪耀的亮点之一，便是大胆引入了ChatGPT和DeepSeek技术。它们恰似无所不能的“数据魔法师”
python3实现爬取淘宝页面的商品的数据信息（selenium+pyquery+mongodb） flood_d mongodb python selenium pyquery 爬虫
1.环境须知做这个爬取的时候需要安装好python3.6和selenium、pyquery等等一些比较常用的爬取和解析库，还需要安装MongoDB这个分布式数据库。2.直接上代码spider.pyimportrefromconfigimport*importpymongofromseleniumimportwebdriverfromselenium.common.exceptionsimportT
一篇文章教会你用Python爬取淘宝评论数据【淘宝商品评论数据接口参数】 Tinalee-电商API接口呀主流电商数据采集API接口淘宝天猫商品API接口淘宝商品评论API接口 python 开发语言人工智能大数据爬虫 java
【一、项目简介】本文主要目标是采集淘宝的评价，找出客户所需要的功能。统计客户评价上面夸哪个功能多，比如防水，容量大，好看等等。【二·淘宝/天猫获得淘宝商品评论API返回值】item_review-获得淘宝商品评论taobao.item_review公共参数名称类型必须描述keyString是调用key（必须以GET方式拼接在URL中）secretString是调用密钥api_nameString是
Python for Android 安装和配置指南舒欣和Queenly
PythonforAndroid安装和配置指南python-for-androidTurnyourPythonapplicationintoanAndroidAPK项目地址:https://gitcode.com/gh_mirrors/py/python-for-android1.项目基础介绍和主要编程语言项目基础介绍PythonforAndroid(p4a)是一个开源工具，旨在将Python应用
python -m bitsandbytes 报错解释与解决 MityKif python 开发语言
RuntimeError:CUDASetupfaileddespiteGPUbeingavailable.Pleaserunthefollowingcommandtogetmoreinformation:python-mbitsandbytesInspecttheoutputofthecommandandseeifyoucanlocateCUDAlibraries.Youmightneedtoad
推特关键词爬虫Python实现最新版（2025.2.20）才华是浅浅的耐心爬虫 python 开发语言
引言随着各类自媒体平台的兴起，数据挖掘和分析变得尤为重要。推特作为全球最大的自媒体平台，越来越来越多的人需要通过爬取其内容进行分析。然后自从马斯克接手推特之后，推特api不可再用，推特的反爬力度也在逐渐增强。今天小编就分享一个推特爬虫的教程。描述这篇文章主要通过关键词爬取帖子内容信息以及帖子作者主页相关信息，用户也可根据自己需要的时间段进行筛选。推特可支持筛选多种语言，我这里先展示中文和英文的。字
springmvc 下 freemarker页面枚举的遍历输出杨白白 enum freemarker
spring mvc freemarker 中遍历枚举 1枚举类型有一个本地方法叫values（），这个方法可以直接返回枚举数组。所以可以利用这个遍历。 enum public enum BooleanEnum { TRUE(Boolean.TRUE, "是"), FALSE(Boolean.FALSE, "否");
实习简要总结 byalias 工作
来白虹不知不觉中已经一个多月了，因为项目还在需求分析及项目架构阶段，自己在这段时间都是在学习相关技术知识，现在对这段时间的工作及学习情况做一个总结：（1）工作技能方面大体分为两个阶段，Java Web 基础阶段和Java EE阶段 1）Java Web阶段在这个阶段，自己主要着重学习了 JSP, Servlet, JDBC, MySQL，这些知识的核心点都过了一遍，也
Quartz——DateIntervalTrigger触发器 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2208559 一.概述 simpleTrigger 内部实现机制是通过计算间隔时间来计算下次的执行时间，这就导致他有不适合调度的定时任务。例如我们想每天的 1：00AM 执行任务，如果使用 SimpleTrigger，间隔时间就是一天。注意这里就会有一个问题，即当有 misfired 的任务并且恢复执行时，该执行时间
Unix快捷键 18289753290 unix Unix；快捷键;
复制，删除，粘贴： dd:删除光标所在的行 &nbs
获取Android设备屏幕的相关参数酷的飞上天空 android
包含屏幕的分辨率以及屏幕宽度的最大dp 高度最大dp TextView text = (TextView)findViewById(R.id.text); DisplayMetrics dm = new DisplayMetrics(); text.append("getResources().ge
要做物联网？先保护好你的数据蓝儿唯美数据
根据Beecham Research的说法，那些在行业中希望利用物联网的关键领域需要提供更好的安全性。在Beecham的物联网安全威胁图谱上，展示了那些可能产生内外部攻击并且需要通过快速发展的物联网行业加以解决的关键领域。 Beecham Research的技术主管Jon Howes说：“之所以我们目前还没有看到与物联网相关的严重安全事件，是因为目前还没有在大型客户和企业应用中进行部署，也就
Java取模（求余）运算随便小屋 java
整数之间的取模求余运算很好求，但几乎没有遇到过对负数进行取模求余，直接看下面代码： /** * * @author Logic * */ public class Test { public static void main(String[] args) { // TODO A
SQL注入介绍 aijuans sql注入
二、SQL注入范例这里我们根据用户登录页面 <form action="" > 用户名：<input type="text" name="username"><br/> 密码：<input type="password" name="passwor
优雅代码风格 aoyouzi 代码
总结了几点关于优雅代码风格的描述：代码简单：不隐藏设计者的意图，抽象干净利落，控制语句直截了当。接口清晰：类型接口表现力直白，字面表达含义，API 相互呼应以增强可测试性。依赖项少：依赖关系越少越好，依赖少证明内聚程度高，低耦合利于自动测试，便于重构。没有重复：重复代码意味着某些概念或想法没有在代码中良好的体现，及时重构消除重复。战术分层：代码分层清晰，隔离明确，
布尔数组百合不是茶 java 布尔数组
androi中提到了布尔数组; 布尔数组默认的是false, 并且只会打印false或者是true 布尔数组的例子; 根据字符数组创建布尔数组 char[] c = {'p','u','b','l','i','c'}; //根据字符数组的长度创建布尔数组的个数 boolean[] b = new bool
web.xml之welcome-file-list、error-page bijian1013 java web.xml servlet error-page
welcome-file-list 1.定义： <welcome-file-list> <welcome-file>login.jsp</welcome> </welcome-file-list> 2.作用：用来指定WEB应用首页名称。 error-page1.定义： <error-page&g
richfaces 4 fileUpload组件删除上传的文件 sunjing clear Richfaces 4 fileupload
页面代码 <h:form id="fileForm"> <rich:
技术文章备忘 bit1129 技术文章
Zookeeper http://wenku.baidu.com/view/bab171ffaef8941ea76e05b8.html http://wenku.baidu.com/link?url=8thAIwFTnPh2KL2b0p1V7XSgmF9ZEFgw4V_MkIpA9j8BX2rDQMPgK5l3wcs9oBTxeekOnm5P3BK8c6K2DWynq9nfUCkRlTt9uV
org.hibernate.hql.ast.QuerySyntaxException: unexpected token: on near line 1解决方案白糖_ Hibernate
文章摘自：http://blog.csdn.net/yangwawa19870921/article/details/7553181 在编写HQL时，可能会出现这种代码： select a.name,b.age from TableA a left join TableB b on a.id=b.id 如果这是HQL，那么这段代码就是错误的，因为HQL不支持
sqlserver按照字段内容进行排序 bozch 按照内容排序
在做项目的时候，遇到了这样的一个需求：从数据库中取出的数据集，首先要将某个数据或者多个数据按照地段内容放到前面显示，例如:从学生表中取出姓李的放到数据集的前面； select * fro
编程珠玑-第一章-位图排序 bylijinnan java 编程珠玑
import java.io.BufferedWriter; import java.io.File; import java.io.FileWriter; import java.io.IOException; import java.io.Writer; import java.util.Random; public class BitMapSearch {
Java关于==和equals chenbowen00 java
关于==和equals概念其实很简单，一个是比较内存地址是否相同，一个比较的是值内容是否相同。虽然理解上不难，但是有时存在一些理解误区，如下情况： 1、 String a = "aaa"; a=="aaa"; ==> true 2、 new String("aaa")==new String("aaa
[IT与资本]软件行业需对外界投资热情保持警惕 comsci it
我还是那个看法,软件行业需要增强内生动力,尽量依靠自有资金和营业收入来进行经营,避免在资本市场上经受各种不同类型的风险,为企业自主研发核心技术和产品提供稳定,温和的外部环境... 如果我们在自己尚未掌握核心技术之前,企图依靠上市来筹集资金,然后使劲往某个领域砸钱,然
oracle 数据块结构 daizj oracle 块数据块块结构行目录
oracle 数据块是数据库存储的最小单位，一般为操作系统块的N倍。其结构为：块头－－〉空行－－〉数据，其实际为纵行结构。块的标准大小由初始化参数DB_BLOCK_SIZE指定。具有标准大小的块称为标准块（Standard Block）。块的大小和标准块的大小不同的块叫非标准块（Nonstandard Block）。同一数据库中，Oracle9i及以上版本支持同一数据库中同时使用标
github上一些觉得对自己工作有用的项目收集 dengkane github
github上一些觉得对自己工作有用的项目收集技能类 markdown语法中文说明回到顶部全文检索 elasticsearch bigdesk elasticsearch管理插件回到顶部 nosql mapdb 支持亿级别map, list, 支持事务. 可考虑做为缓存使用 C
初二上学期难记单词二 dcj3sjt126com english word
dangerous 危险的 panda 熊猫 lion 狮子 elephant 象 monkey 猴子 tiger 老虎 deer 鹿 snake 蛇 rabbit 兔子 duck 鸭 horse 马 forest 森林 fall 跌倒；落下 climb 爬；攀登 finish 完成；结束 cinema 电影院；电影 seafood 海鲜；海产食品 bank 银行
8、mysql外键(FOREIGN KEY)的简单使用 dcj3sjt126com mysql
一、基本概念 1、MySQL中“键”和“索引”的定义相同，所以外键和主键一样也是索引的一种。不同的是MySQL会自动为所有表的主键进行索引，但是外键字段必须由用户进行明确的索引。用于外键关系的字段必须在所有的参照表中进行明确地索引，InnoDB不能自动地创建索引。 2、外键可以是一对一的，一个表的记录只能与另一个表的一条记录连接，或者是一对多的，一个表的记录与另一个表的多条记录连接。 3、如
java循环标签 Foreach shuizhaosi888 标签 java循环 foreach
1. 简单的for循环 public static void main(String[] args) { for (int i = 1, y = i + 10; i < 5 && y < 12; i++, y = i * 2) { System.err.println("i=" + i + " y="
Spring Security（05）——异常信息本地化 234390216 exception Spring Security 异常信息本地化
异常信息本地化 Spring Security支持将展现给终端用户看的异常信息本地化，这些信息包括认证失败、访问被拒绝等。而对于展现给开发者看的异常信息和日志信息（如配置错误）则是不能够进行本地化的，它们是以英文硬编码在Spring Security的代码中的。在Spring-Security-core-x
DUBBO架构服务端告警Failed to send message Response javamingtingzhao 架构 DUBBO
废话不多说，警告日志如下，不知道有哪位遇到过，此异常在服务端抛出(服务器启动第一次运行会有这个警告)，后续运行没问题，找了好久真心不知道哪里错了。 WARN 2015-07-18 22:31:15,272 com.alibaba.dubbo.remoting.transport.dispatcher.ChannelEventRunnable.run(84)
JS中Date对象中几个用法 leeqq JavaScript Date 最后一天
近来工作中遇到这样的两个需求 1. 给个Date对象，找出该时间所在月的第一天和最后一天 2. 给个Date对象，找出该时间所在周的第一天和最后一天需求1中的找月第一天很简单，我记得api中有setDate方法可以使用使用setDate方法前，先看看getDate var date = new Date(); console.log(date); // Sat J
MFC中使用ado技术操作数据库你不认识的休道人 sql mfc
1.在stdafx.h中导入ado动态链接库 #import"C:\Program Files\Common Files\System\ado\msado15.dll" no_namespace rename("EOF","end")2.在CTestApp文件的InitInstance()函数中domodal之前写::CoIniti
Android Studio加速 rensanning android studio
Android Studio慢、吃内存！启动时后会立即通过Gradle来sync & build工程。（1）设置Android Studio a) 禁用插件 File -> Settings... Plugins 去掉一些没有用的插件。比如：Git Integration、GitHub、Google Cloud Testing、Google Cloud
各数据库的批量Update操作 tomcat_oracle java oracle sql mysql sqlite
MyBatis的update元素的用法与insert元素基本相同，因此本篇不打算重复了。本篇仅记录批量update操作的 sql语句，懂得SQL语句，那么MyBatis部分的操作就简单了。　　注意：下列批量更新语句都是作为一个事务整体执行，要不全部成功，要不全部回滚。 MSSQL的SQL语句　WITH R AS（　　SELECT 'John' as name, 18 as
html禁止清除input文本输入缓存 xp9802 input
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; eg: <input type="text" autocomplete="off" name