本文是博主在备考时整理的一些笔记,内容若存在错误,可在评论区指正,非常感谢!<(^-^)>

系列笔记导航🚌🚌
1.🧬计算机应用基础笔记(一)
2.🎣计算机应用基础笔记(二)
3.🎐计算机应用基础笔记(三)
4.🎨计算机应用基础笔记(四)

多媒体技术

文本与文本处理

  1. 文本
    (1)文本由一系列 “字符”(character)组成,每个字符均使用二进制编码表示
    (2)文本在计算机中的处理过程是:输入(输入码输入计算机)->存储(机内码存储)->编辑(word,wps 等软件)->显示(字形码,显示)

  2. ASCII码(西文字符的编码)
    (1)ASCII 码:美国信息交换标准码
    (2)ASCII 字符集包含 96 个可打印字符和 32 个控制字符,一共能表示 128个字符
    (3)采用 7 个二进位进行编码,是高位位置用 0 表示,共一个字节 8 位。
    (4)计算机中使用 1 个字节存储 1 个 ASCII 字符,单字节表示。
    (5)常用字符的 ASCII 码:0=48 ; A=65 ; a=97 ; a-A=32D=20H(D 为十进制,H 为十六进制数)
    (6)大写字母可以通过加 32D得到对应的小写字母。A+32=97=a。(D 为十进制,H 为十六进制数)
    (7)小写字母可以通过减 32D得到对应的大写字母。a-32=65=A。(D 为十进制,H 为十六进制数)

    ASCII 码值排序:

    符号(()+-*/等) < 数字(0-9) < 符号(:;<=>?)< 大写字母(A-Z) < 小写字母(a-z)

  3. 常用的汉字编码字符集:
    (1)国家标准:GB2312-1980(GB2312-80):简体中文为主。
    (2)汉字扩充规范:GBK:支持繁体中文。
    (3)UCS/Unicode 多文种大字符集也包含汉字:UTF-8,UTF-16:多种文字符号,支持简繁中文。
    (4)国家标准 GB18030-2005:繁简体中文,与 UCS/Unicode 编码标准接轨。
    (5)港澳台使用的汉字编码字符集 CNS 11643(BIG 5 ,“大五码”):繁体中文

  4. GB2312-1980 (7445 个)
    (1)一个 GB2312 汉字使用 2 个字节(16 位)表示,即双字节表示。
    (2)每个字的最高位均为 1,双 1 表示。

    GB2312-1980的字节表示
    GB2312-1980的字节表示

    (3)区位码+2020H=国标码;国标码+8080H=机内码;区位码+A0A0H=机内码。

    高频考点 题目可能给出是十进制的区位码,比如4907D,需要将其转换成16进制数,一个字节一个字
    节转哦,49D=31H,07D=07H。然后再进行计算机内码(逢十六进1)

  5. GBK 汉字内码扩充规范
    (1)与 GB8312 保持向下兼容,也使用双字节表示,第 1 字节最高位必须为“1”:

    GBK的字节表示
    GBK的字节表示
    说了这么多,感觉还是挺乱的,直接上图
    各种编码格式的关系
    各种编码格式的关系
  6. 超文本
    (1)超文本:可以对文本进行跳转、导航、返回的操作,实现文本更为方便的访问,采用网状结构组织信息。WWW 网页就是典型的超文本结构。
    (2)“超链”实际上就是一个指针,用于指向其他网页,也可以指向同一网页中的其他部分。点我看看?

  7. 文本编辑和文本处理

    • 文字格式∶字体、字号、颜色、字符间距等。
    • 段落格式∶行距、段前距、段缩进等。
    • 页面格式∶页边距、分栏、页眉/页脚。
    • 字数统计,词频统计,简/繁体相互转换,汉字/拼音相互转换
    • 词语排序,词语错误检测,文句语法检查
    • 自动分词,词性标注,词义辨识,大陆/台湾术语转换
    • 关键词提取,文摘自动生成,文本分类
    • 文本检索(关键词检索、全文检索),文本过滤
    • 文语转换(语音合成)
    • 文种转换(机器翻译)
    • 篇章理解,自动问答,自动写作等
    • 文本压缩,文本加密,文本著作权保护

图像与图形及应用

  1. 图像
    (1)通过数字化设备从现实世界中获取数字图像(取样图像、点阵图像、位图图像)。它是通过描述画
    面中每一个像素的亮度或颜色来表示其内容的。
    (2)常用的图像获取设备:手机、扫描仪、数码相机、监控摄像头

  2. 图形:计算机合成制作的图像称为矢量图形,简称图形。

  3. 图像的获取过程:①扫描->②分色->③取样->④量化
    (1)扫描:将映像画面划分为 M × N 个网格,每个网格称为 一个取样点,称为素像(素像点)
    (2)分色:将彩色图像取样点的颜色分解成 RGB 三个基色
    (3)取样:测量每个取样点的每个分量(基色)的亮度值
    (4)量化:对取样点每个分量的亮度进行 A/D 转换,使用数字整型量表示

  4. 数字图像的组成
    (1)数字取样图像由 M(列) × N(行)个取样点组成
    (2)取样点是组成数字取样图像的基本单位,称为像素
    (3)彩色图像的像素通常由 3 个彩色分量组成

彩色图像的每个像素有三个分量,分别表示三个基色的亮度,假设 3 个分量分别用 n,m,k 个二进位表示,则可表示 2^(n+m+k)种不同的颜色。

灰度图像和黑白图像的像素只包含 1 个亮度分量

黑白图像的每个像素只有一个分量,且只用 1 个二进位表示,其取值仅“0”(黑)和“1”(白)两种。

灰度图像的每个像素也只有一个分量,一般用 8~12 个二进位表示,其取值范围是:0~(2^n)-1,可表
示 2^n个不同的亮度

  1. 数字图像的主要参数
    • 图像大小(图像分辨率):水平分辨率 x 垂直分辨率
    • 位平面数目,即像素的颜色分量的数目
    • 颜色空间的类型,指彩色图像所使用的颜色描述方法:

RGB(红、绿、蓝)模型,显示器使用
CMYK(青、品红、黄、黑)模型,彩色打印机使用
HSB(色彩、饱和度、亮度)模型,用户界面中使用
YUV(亮度、色度)模型,彩色电视信号传输时使用

  1. 图像数据量=水平分辨率 X 垂直分辨率 X 像素深度/8
  2. 数字图像的常用文件格式

    JPEG(静态图像压缩编码国际标准),大多数为有损压缩
    JPEG 图像压缩比可由用户控制, 压缩比越高图像质量越差
    JPEG 不支持支持透明背景

    BMP 图像格式是 Wndows 操作系统下使用的一种标准图像格式,无损压缩
    支持单色、16 色、256 色、真彩色图像

    GIF 图像格式颜色数目不超过 256 色,适合用作插画、剪贴画等色彩要求不高的场合,文件特点小,适合网络传输,为无损压缩。
    GIF 图像格式能支持透明背景
    GIF 图像格式能支持动画。
    不适合真彩色图片

    PNG 是 W3C 开发一种图文格式,保留了 GIF 文件特性,扩充了其功能。主要用于互联网。