1071 Speech Patterns (25 分)

2023年6月7日下午10:35 • 数据结构和算法 • 阅读 90

1. 题目

People often have a preference among synonyms of the same word. For example, some may prefer “the police”, while others may prefer “the cops”. Analyzing such patterns can help to narrow down a speaker’s identity, which is useful when validating, for example, whether it’s still the same person behind an online avatar.

Now given a paragraph of text sampled from someone’s speech, can you find the person’s most commonly used word?

Each input file contains one test case. For each case, there is one line of text no more than 1048576 characters in length, terminated by a carriage return \n. The input contains at least one alphanumerical character, i.e., one character from the set [0-9 A-Z a-z].

For each test case, print in one line the most commonly occurring word in the input text, followed by a space and the number of times it has occurred in the input. If there are more than one such words, print the lexicographically smallest one. The word should be printed in all lower case. Here a “word” is defined as a continuous sequence of alphanumerical characters separated by non-alphanumerical characters or the line beginning/end.

Note that words are case insensitive.

Can1: "Can a can can a can?  It can!"

can 5

2. 题意

给出一串字符串，找出其中出现次数最多的单词，输出该单词的小写形式及出现次数。注：单词由[0-9 A-Z a-z]字符组成，单词间以非字母或数字相隔，单词不区分大小写。

3. 思路——字符串+map

4. 代码

#include
#include
#include
#include

using namespace std;

int main()
{
    string str;
    getline(cin, str);

    // 将输入字符串中的所有大写字母转化为小写
    for (int i = 0; i < str.length(); ++i)
        if (isupper(str[i])) str[i] = str[i] - 'A' + 'a';

    string temp = "";
    int maxCnt = 0;
    string maxStr = "";
    map res;
    for (int i = 0; i < str.length(); ++i)
    {
        if (!isalnum(str[i]))
        {
            // 这个if主要是排除掉空字符串计数的问题
            // 空字符串出现的原因主要有连续几个字符都是非字母或非数字
            // 只要判断当前字符的前一个字符是否也非字母或非数字，如果是则不计数
            if (i && !isalnum(str[i - 1]))
            {
                temp = "";
                continue;
            }
            // 当碰到非字符或非数字，进行计数，并置空temp字符串，重新获取单词信息
            res[temp] += 1;
            if (res[temp] > maxCnt)
            {
                maxCnt = res[temp];
                maxStr = temp;
            }
            temp = "";
        } else
        {
            temp += str[i];
        }
    }
    // 避免最后一个单词没有计数的问题
    // 因为如果最后一个字符为字母或数字，那么上面循环结束后最后一个单词没有计数
    if (isalnum(str[str.length() - 1]))
    {
        res[temp] += 1;
        if (res[temp] > maxCnt)
        {
            maxCnt = res[temp];
            maxStr = temp;
        }
    }
    cout << maxStr << " " << maxCnt << endl;
    return 0;
}

Original: https://www.cnblogs.com/vanishzeng/p/15479945.html
Author: vanish丶
Title: 1071 Speech Patterns (25 分)

原创文章受到原创版权保护。转载请注明出处：https://www.johngo689.com/584678/

转载文章受原作者版权保护。转载请注明原作者出处！

数据结构和算法

【自取】最近整理的，有需要可以领取学习：

Linux核心资料大放送~

全栈面试题汇总（持续更新&可下载）

一个提高学习100%效率的工具！

【超详细】深度学习面试题目！

LeetCode Python刷题答案下载！

LeetCode Java版刷题答案下载！

LeetCode C++ 版本，抓紧保存！

LeetCode GO语言刷题答案下载！

控制手柄-CapsuleBoundsHandle

和SphereBoundsHandle的主要区别是这边有radius, height, heightAxis三个参数，没有size参数，其他基本一致 using UnityEdit…

数据结构和算法 2023年6月7日
00101
第三届江西省网络安全大赛-部分Crypto

一、Round 题目附件如下：比赛题目flag为’CMISCCTF{}’的模式，可以发现’:D@J::K=r Original: https:…

数据结构和算法 2023年6月7日
00101
Jetbrains 缓存清理与安装优化

jetbrains 这些热门 ide，如 pycharm， webstorm， goland , idea 在操作系统上安装后的文件结构非常一致，并且升级频繁。在升级中版本以上时，…

数据结构和算法 2023年6月12日
00113
学习札礼——数据结构

哈希表出了不能求循环节在都比KMP强把-10e9~10e9的数映射为0~10e5，xmodN（要把N设置为第一个大于的质数，减少冲突）开放寻址法核心就是先找个一个位置，如果这…

数据结构和算法 2023年6月7日
0087
打印数组的所有子集

打印数组的所有子集作者：Grey 原文地址：博客园：打印数组的所有子集 CSDN：打印数组的所有子集无重复值情况题目描述见: LeetCode 78. Subsets 主要…

数据结构和算法 2023年6月12日
0087
MySQL笔记汇总(1)基础篇

通用语法及分类 DDL: 数据定义语言，用来定义数据库对象（数据库、表、字段） DML: 数据操作语言，用来对数据库表中的数据进行增删改 DQL: 数据查询语言，用来查询数据库中表…

数据结构和算法 2023年6月16日
00101
算法竞赛网站推荐——OI WiKi

网址：https://oi-wiki.org/ 相关竞赛内容比较全，适合各类人群。 posted @2022-05-15 00:14 Johnson-Hugo 阅读(343 ) 评…

数据结构和算法 2023年6月7日
00119
分布式ID生成方案

分布式ID策略为什么要用分布式ID？在我们业务数据量不大的时候，单库单表完全可以支撑现有业务，数据再大一点搞个 MySQL 主从同步读写分离也能对付。但随着数据日渐增长，主从…

数据结构和算法 2023年6月8日
00123
JZ049从根节点到叶子节点的数字之和

📃 题目描述题目链接：从根节点到叶子节点的数字之和、相同题目 🔔 解题思路方法一：递归回溯，主要判断好：当前结点传什么值进来，我传入的是上一个节点加入节点值后扩大十倍； cl…

数据结构和算法 2023年6月12日
00103
kivy入门之布局(五)

创建多页面布局 1 from kivy.app import App 2 from kivy.uix.button import Button 3 from kivy.uix.pa…

数据结构和算法 2023年6月12日
0088
「codeforces-1720」

壹最近 cq 情况很急急，昨天出去排核酸整了两个半小时，十分无语。提前放假自然是一大好事，但是一个人在家也蛮无聊。不要再涨体重了为好，这一年间他妈 delta 了 10 kilo…

数据结构和算法 2023年6月12日
00103
【Unity】脚本：物体旋转的几种方法(记录)

如下： //第一种：旋转了…

数据结构和算法 2023年6月16日
0076
AcWing 1275. 最大数（线段树）

题目描述题目链接题目思路维护当前结点的最大值向序列后添加一个数，相当于将最后一个数修改为某数询问这个序列中最后L个数中最大的数是多少，相当于求两个子结点的最大值题目代码…

数据结构和算法 2023年6月16日
00100
C++：数的变化

时间限制 : 1.000 sec 内存限制 : 128 MB 题目描述：小明给你提出了一个问题，即给出两个整数 a 和 b，每次操作可以 a+1 或 a×2，问至少进行多少次操作…

数据结构和算法 2023年6月8日
00104
[总结]2022-2-9

春节后第一场比赛，状态不好。 P1心路历程看到T1马上想到了勾股定理，但没有很好的做法。T2认为是比较好拿部分分的，T3认为可以转化为树形dp来做，但确实不可以。T4也实在没有什…

数据结构和算法 2023年6月8日
0090
prim算法求最小生成树

例题链接最小生成树的含义是，假设给定n个点，m条边(m > n – 1),在m条边中选择n – 1条边将n个点连接成一个连通图，即一棵生成树。因为每…

数据结构和算法 2023年6月8日
00117

2024 年 5 月
一	二	三	四	五	六	日
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

1071 Speech Patterns (25 分)

1. 题目

2. 题意

3. 思路——字符串+map

4. 代码

大家都在看