C语言—统计一串字符中各个字符的出现频率

1 目标效果

编写程序,能够统计某一段字符串中各个字符出现的次数。比如输入一串“abcade”,能够统计出其中各个字母的出现频率。

2 程序实现

2.1 程序代码

#include<stdio.h>
#include<string.h>

void main()
{
    char str[20];   // 输入的字符串
    int i,num[256]={0};   // 统计次数时的变量
    printf("please input string:n");
    scanf("%s",str);
    // 统计次数
    for(i=0;i<strlen(str);i++)
        num[(int)str[i]]++;
    // 显示结果
    for(i=0;i<256;i++)
        if(num[i]!=0)
            printf("字符%c出现%d次n",(char)i,num[i]);
}

2.2 实现思路

这里实现思路比较巧妙,变量i用来做for循环的变量。num[]这个数组是给每一个ASIIC字符开辟的数组,通过(int)str[i]在遍历整个输入字符串str[]的同时,给每一个ASIIC码都确定了一个计次变量的存储位置。num[]++是ASIIC码对应字符出现次数自加操作。for循环的过程中num[(int)str[i]]用来记录每一个出现过的字符的次数,当统计完成后开始准备输出结果。

显示统计结果是也比较巧妙,经过第一个统计次数的for循环后,每一个出现过的字符的num[]对应位置的值都不为0,而且其索引,也就是第二个for循环中的i,恰好是其统计的字符对应的ASIIC码的值。因此在输出时(char)i是出现过的字符串,num[i]对应其出现过的次数。

为了方便理解,加上一些输出中间过程值的printf语句来观察整个程序运行的逻辑。修改后的代码如下

#include<stdio.h>
#include<string.h>

void main()
{
    char str[20];   // 输入的字符串
    int i,num[256]={0};   // 统计次数时的变量
    printf("please input string:n");
    scanf("%s",str);
    
    // 统计各个字符出现的次数
    for(i=0;i<strlen(str);i++)
    {
        num[(int)str[i]]++;
        printf("i=%dn",i);
        printf("str[i]=%dn",str[i]);
        printf("num[(int)str[i]]=%dn",num[(int)str[i]]);
    }
    
    for(i=0;i<256;i++)
    {
        if(num[i]!=0)
        {
            printf("字符%c出现%d次n",(char)i,num[i]);
        }
    }
}

输入asdfasdfghjkjuhgfdsa后观察输出结果,如下

i=0   // 开始遍历输入字符串str中的第一个字符
str[i]=97   // 字母a对应的ASIIC码值
num[(int)str[i]]=1   // num中索引为97的位置加了1

i=1   // 开始遍历输入字符串str中的第一个字符
str[i]=115   // 字母s对应的ASIIC码值
num[(int)str[i]]=1   // num中索引为115的位置加了1

i=2
str[i]=100
num[(int)str[i]]=1

i=3
str[i]=102
num[(int)str[i]]=1

i=4
str[i]=97
num[(int)str[i]]=2

i=5
str[i]=115
num[(int)str[i]]=2

i=6
str[i]=100
num[(int)str[i]]=2

i=7
str[i]=102
num[(int)str[i]]=2

i=8
str[i]=103
num[(int)str[i]]=1

i=9
str[i]=104
num[(int)str[i]]=1

i=10
str[i]=106
num[(int)str[i]]=1

i=11
str[i]=107
num[(int)str[i]]=1

i=12
str[i]=106
num[(int)str[i]]=2

i=13
str[i]=117
num[(int)str[i]]=1

i=14
str[i]=104
num[(int)str[i]]=2

i=15
str[i]=103
num[(int)str[i]]=2

i=16
str[i]=102
num[(int)str[i]]=3

i=17
str[i]=100
num[(int)str[i]]=3

i=18
str[i]=115
num[(int)str[i]]=3

i=19
str[i]=97
num[(int)str[i]]=3

// 最终统计结果
字符a出现3次
字符d出现3次
字符f出现3次
字符g出现2次
字符h出现2次
字符j出现2次
字符k出现1次
字符s出现3次
字符u出现1

经过测试,该程序统计长度为20的字符串中每个字符出现的频率耗费的大概是4ms
在这里插入图片描述