词频统计程序

具体代码如下:

#include 
#include 
#include 
#define N 50
typedef struct BiTNode
{
    char data[N];
    int count;
    struct BiTNode *lChild;
    struct BiTNode *rChild;
}BiTNode,*BiTree;

int GetWord(int start,int end,char* pBuf,char* word);       //词汇
void CreateSearchTree(char* item,BiTree& T);                //创建二叉树进行查找
void InOrderAndPrint(BiTree T,FILE* pf);                    //进行中序遍历查找并写入文件
int sum=0;
char temp1[N];
char temp2[N];

int main()
{   while(1){
    //获取输入文件名
    char fileName[30];
    memset(fileName,0,sizeof(fileName));
    printf("请输入查找的文件名(例:example.txt): ");
    scanf("%s",fileName);
    //打开需要统计词汇的文件
    FILE* pf;
    pf=fopen(fileName,"rb");
    if(pf==NULL)
    {
        printf("找不到文件!无法打开文件\n");
        return false;
    }
    printf("* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * \n");
    printf("成功打开文件--- %s !\n\n",fileName); 
    printf("* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * \n");
	printf("原文内容为:\n");
    //读取文件
    fseek(pf,0,SEEK_END);
    int len=ftell(pf);
    rewind(pf);
    char *pBuf=new char[len+1];
    pBuf[len]=0;
    fread(pBuf,1,len,pf);
    fclose(pf);

    //读取单词
    printf("%s\n",pBuf);
    printf("*****************************************************************************\n\n");
	printf("将统计写入文件(如:1.txt )\n");
	


    int i=0;
    char word[N];
    BiTree T=NULL;
    while(idata,item);
        T->count=1;
        T->lChild=NULL;  
        T->rChild=NULL;
    }
    else
    {
        strcpy(temp2,T->data);
        temp2[0]=tolower(T->data[0]);
        if(strcmp(temp1,temp2)==-1)
        {
            CreateSearchTree(item,T->lChild);
        }
        else if(strcmp(temp1,temp2)==1)
        {   
            CreateSearchTree(item,T->rChild);
        }
        else
        {
            T->count++;
        }
    }
}

//进行中序遍历查找并写入文件
void InOrderAndPrint(BiTree T,FILE* pf)
{
    if(T!=NULL)
    {
        InOrderAndPrint(T->lChild,pf);
        fprintf(pf,"出现的词汇:%-30s 频率:%-9d\t\n",T->data,T->count);
        printf("出现的词汇:%-30s 频率:%-9d\t\n",T->data,T->count);
        InOrderAndPrint(T->rChild,pf);
    }
}


 

你可能感兴趣的:(词频统计程序)