计算机应用基础笔记(四)

本文是博主在备考时整理的一些笔记,内容若存在错误,可在评论区指正,非常感谢!<(^-^)>
系列笔记导航🚌🚌
1.🧬计算机应用基础笔记(一)
2.🎣计算机应用基础笔记(二)
3.🎐计算机应用基础笔记(三)
4.🎨计算机应用基础笔记(四)
多媒体技术
文本与文本处理
文本
(1)文本由一系列 “字符”(character)
组成,每个字符均使用二进制编码表示
(2)文本在计算机中的处理过程是:输入(输入码输入计算机)->存储(机内码存储)->编辑(word,wps 等软件)->显示(字形码,显示)ASCII码(西文字符的编码)
(1)ASCII 码:美国信息交换标准码
(2)ASCII 字符集包含96
个可打印字符和32
个控制字符,一共能表示128
个字符
(3)采用 7 个二进位进行编码,是高位位置用 0 表示,共一个字节 8 位。
(4)计算机中使用 1 个字节存储 1 个 ASCII 字符,单字节表示。
(5)常用字符的 ASCII 码:0=48 ; A=65 ; a=97 ; a-A=32D=20H(D 为十进制,H 为十六进制数)
(6)大写字母可以通过加32D
得到对应的小写字母。A+32=97=a。(D 为十进制,H 为十六进制数)
(7)小写字母可以通过减32D
得到对应的大写字母。a-32=65=A。(D 为十进制,H 为十六进制数)ASCII 码值排序:
符号(()+-*/等) < 数字(0-9) < 符号(:;<=>?)< 大写字母(A-Z) < 小写字母(a-z)
常用的汉字编码字符集:
(1)国家标准:GB2312-1980(GB2312-80):简体中文为主。
(2)汉字扩充规范:GBK:支持繁体中文。
(3)UCS/Unicode 多文种大字符集也包含汉字:UTF-8,UTF-16:多种文字符号,支持简繁中文。
(4)国家标准 GB18030-2005:繁简体中文,与 UCS/Unicode 编码标准接轨。
(5)港澳台使用的汉字编码字符集 CNS 11643(BIG 5 ,“大五码”):繁体中文 GB2312-1980 (7445 个)
(1)一个 GB2312 汉字使用 2 个字节(16 位)表示,即双字节表示。
(2)每个字的最高位均为 1,双 1 表示。GB2312-1980的字节表示(3)区位码+2020H=国标码;国标码+8080H=机内码;区位码+A0A0H=机内码。
高频考点 题目可能给出是十进制的区位码,比如4907D,需要将其转换成16进制数,一个字节一个字
节转哦,49D=31H,07D=07H。然后再进行计算机内码(逢十六进1)GBK 汉字内码扩充规范
(1)与 GB8312 保持向下兼容,也使用双字节表示,第 1 字节最高位必须为“1”:说了这么多,感觉还是挺乱的,直接上图GBK的字节表示各种编码格式的关系超文本
(1)超文本:可以对文本进行跳转、导航、返回的操作,实现文本更为方便的访问,采用网状结构组织信息。WWW 网页
就是典型的超文本结构。
(2)“超链”实际上就是一个指针,用于指向其他网页,也可以指向同一网页中的其他部分。点我看看?文本编辑和文本处理
- 文字格式∶字体、字号、颜色、字符间距等。
- 段落格式∶行距、段前距、段缩进等。
- 页面格式∶页边距、分栏、页眉/页脚。
- 字数统计,词频统计,简/繁体相互转换,汉字/拼音相互转换
- 词语排序,词语错误检测,文句语法检查
- 自动分词,词性标注,词义辨识,大陆/台湾术语转换
- 关键词提取,文摘自动生成,文本分类
- 文本检索(关键词检索、全文检索),文本过滤
- 文语转换(语音合成)
- 文种转换(机器翻译)
- 篇章理解,自动问答,自动写作等
- 文本压缩,文本加密,文本著作权保护
图像与图形及应用
图像
(1)通过数字化设备从现实世界中获取数字图像(取样图像、点阵图像、位图图像)。它是通过描述画
面中每一个像素的亮度或颜色来表示其内容的。
(2)常用的图像获取设备:手机、扫描仪、数码相机、监控摄像头等图形:计算机合成制作的图像称为矢量图形,简称图形。
图像的获取过程:①扫描->②分色->③取样->④量化
(1)扫描:将映像画面划分为 M × N 个网格,每个网格称为 一个取样点,称为素像(素像点)
(2)分色:将彩色图像取样点的颜色分解成 RGB 三个基色
(3)取样:测量每个取样点的每个分量(基色)的亮度值
(4)量化:对取样点每个分量的亮度进行 A/D 转换,使用数字整型量表示数字图像的组成
(1)数字取样图像由 M(列) × N(行)个取样点组成
(2)取样点是组成数字取样图像的基本单位,称为像素
(3)彩色图像的像素通常由 3 个彩色分量组成
彩色图像的每个像素有三个分量,分别表示三个基色的亮度,假设 3 个分量分别用 n,m,k 个二进位表示,则可表示 2^(n+m+k)种不同的颜色。
灰度图像和黑白图像的像素只包含 1 个亮度分量
黑白图像的每个像素只有一个分量,且只用 1 个二进位表示,其取值仅“0”(黑)和“1”(白)两种。
灰度图像的每个像素也只有一个分量,一般用 8~12 个二进位表示,其取值范围是:0~(2^n)-1,可表
示 2^n个不同的亮度
- 数字图像的主要参数
- 图像大小(图像分辨率):水平分辨率 x 垂直分辨率
- 位平面数目,即像素的颜色分量的数目
- 颜色空间的类型,指彩色图像所使用的颜色描述方法:
RGB(红、绿、蓝)模型,显示器
使用
CMYK(青、品红、黄、黑)模型,彩色打印机
使用
HSB(色彩、饱和度、亮度)模型,用户界面中
使用
YUV(亮度、色度)模型,彩色电视信号传输时
使用
- 图像数据量=水平分辨率 X 垂直分辨率 X 像素深度/8
数字图像的常用文件格式