Java读取星际译王(StarDict)词库[88250原创]


转载请保留作者信息:

作者: 88250

Blog http:/blog.csdn.net/DL88250

MSN & Gmail & QQ [email protected]



下面的文件是StarDict的词库格式说明文件:



Format for StarDict dictionary files
------------------------------------

StarDict homepage: http://stardict.sourceforge.net
StarDict on-line dictionary: http://www.stardict.org

{
0 }. Number and Byte-order Conventions
When you record the numbers that identify sizes
,  offsets ,  etc. ,  you
should use 
32 -bits numbers ,  such as you might represent with a glong.

In order to make StarDict work on different platforms
,  these numbers
must be in network byte order.  You can ensure the correct byte order
by using the g_htonl() function when creating dictionary files.
Conversely
,  you should use g_ntohl() when reading dictionary files.

Strings should be encoded in UTF-
8 .


{
1 }. Files
Every dictionary consists of these files:
(
1 ). somedict.ifo
(
2 ). somedict.idx or somedict.idx.gz
(
3 ). somedict.dict or somedict.dict.dz
(
4 ). somedict.syn (optional)

You can use gzip -
9  to compress the .idx file. If the .idx file are not 
compressed
,  the loading can be fast and save memory when using ,  compress it 
will make the .idx file load into memory and make the quering become faster 
when using.

You can use dictzip to compress the .dict file.
" dictzip "  uses the same compression algorithm and file format as does gzip ,  
but provides a table that can be used to randomly access compressed blocks 
in the file.  The use of 
50 -64kB blocks for compression typically degrades 
compression by less than 
10 % ,  while maintaining acceptable random access 
capabilities for all data in the file.  As an added benefit
,  files 
compressed with dictzip can be decompressed with gunzip.
For more information about dictzip
,  refer to DICT project ,  please see:
http://www.dict.org

When you create a dictionary
,  you should use .idx and .dict.dz in normal

你可能感兴趣的:(java,.net,qq,Access,Gmail)