十七

轻量级搜索引擎(二)

模块二:网页搜索 该模块用来提供网页搜索功能,当输入一些关键词后,推荐内容相关的网页,作用类似于百度搜索 1 建立网页库、网页偏移库和索引库 1.1 网页库 (1)首先需要建立网页库和网页偏移库,前者用来存储网页的内容,后者用来记录该网页在文件中偏移,方便后续输出这个网页的内容 网页库的格式采用x

十七 Published on 2025-04-10

轻量级搜索引擎(一)

模块一:关键词推荐 1. 创建词典 根据语料库创建词典,语料库就是一些连续的句子,这里使用一些书籍来作为语料库。构建词典的过程就是统计这些语料库中每个词组的词频。 那么如何将连续的句子切分成词组?并统计每个词的词频? 1.1cppjieba安装与使用 https://github.com/yanyi

十七 Published on 2025-04-10

C++八股文(一)基础知识

1. 命名空间 1.1 使用方式: 作用域限定符:wd::number using 编译指令:using namespace std; 问题:using编译指令可能会造成冲突,这是因为using编译指令它会把该空间中的所有实体一次性全部引入 using声明机制:using std::cout; //

十七 Published on 2025-03-04

c++实现线程池

互斥锁#ifndef LOCKER_H#define LOCKER_H#include <exception>#include <pthread.h>#include <semaphore.h>// 线程同步机制封装类// 互斥锁类class locker {pu

十七 Published on 2023-12-04

每日一练(2)

PAT1003 我要通过!答案正确”是自动判题系统给出的最令人欢喜的回复。本题属于 PAT 的“答案正确”大派送 —— 只要读入的字符串满足下列条件,系统就输出“答案正确”,否则输出“答案错误”。得到“答案正确”的条件是:字符串中必须仅有 P、 A、 T这三种字符,不可以包含其它字符;任意形如 xP

十七 Published on 2021-01-22