Table of Contents generated with DocToc
- 入门一下Java
Java教程:廖雪峰Java教程
Eclipse教程:Eclipse 教程
JavaSE15 API文档:Java® Platform, Standard Edition & Java Development Kit Version 15 API Specification
写在前面:仅仅是关键性知识点的笔记,用来串联、查阅和回顾,并不系统也并不细节。
- 1995年发布1.0版本,Java之父James Gosling,SUN公司财产,2009年被Orcale收购。
- Java源文件编译为字节码后运行在虚拟机(JVM)上,字节码与指令集或者操作系统无关,通过在多平台实现虚拟机来实现跨平台。
- JVM解释执行字节码,也就是所谓的解释器, 并不会最终生成不依赖于JVM的目标平台的可执行文件。那么从理解上来说Java的跨平台就可以通过Java源码或者Java字节码来实现。
- Java字节码是二进制文件,可以理解为一层不依赖于硬件平台的指令集。
- Java即要编译也要解释执行,所以称其为混合型语言。那么可预见的多了一层之后Java的性能应该要优于解释型语言如Python,劣于编译型语言如C/C++。
- Java字节码向下兼容,低版本字节码可运行在高版本的JVM上。那么Java语言语法是否向下兼容呢?标准库是否向下兼容呢?
- Java是面向对象的编程语言,类似于C#,不同于C++多范式。当然这无关紧要。
- 名词术语:
- Java SE: 标准版,标准的JVM和标准库
- Java EE: 企业版,在Java SE的基础上加上了大量的API和库,以便方便开发Web应用、数据库、消息服务等
- Java ME: 嵌入式版,针对嵌入式设备的“瘦身版”
- JRE:Java Runtime Environment,包含虚拟机(JVM)和运行时库,只是运行编译好的Java程序的话只安装JRE即可。如果要编译则需要完整的JDK。
- JDK: Java Development Kit,除了JRE还包括编译器调试器等基础设施。前面说的三个版本(SE/EE/ME)就是所谓的JDK。如Java SE Development Kit 8。安装了JDK则不需要再安装JRE。
- JSR:Java Specification Request,Java规范,给Java平台添加工功能时先创建JSP规范,定义好接口,以保证兼容性。发布时还需要同时发布参考实现(RI,Reference Implementation,实现基础功能不保证性能给其他人实现做参考)和兼容性测试套件(TCK,Technology Compatibility Kit,用于兼容性测试)。
- JCP:Java Community Process,负责审核JSR的组织。
- Java版本:1.0 ~ 1.9(1.5 ~ 1.9也称5.0 ~ 9.0),之后10 ~ 15,最新版本Java15。
- 文件后缀:
.java
- 下载JavaSE,安装。
- 配置环境变量:
- Windows:
JAVA_HOME
指向安装目录,把%JAVA_HOME%\bin
添加到path。
- Windows:
java -version
查看版本。bin/
下的执行文件:java
: JVM运行java程序。javac
: 编译器,编译java源文件(.java
)到字节码文件(.class
)。jar
: 打包,把一组.class
打包为.jar
。javadoc
: 从java源码提取注释生成文档。jdb
: java调试器。
- 常用IDE:
- Eclipse: Java开发,基于插件结构。使用广泛,免费。
- IntelliJ Idea:
JetBrains
全家桶系列。商用,有免费和收费版。
- 使用Eclipse:
- 安装:下载Eclipse IDE for Java Developers,无需安装,解压即可使用。
- 汉化:下载中文汉化包,地址,找到IDE对应版本汉化包,找到简体中文的包全部下载下来共20个左右,批量解压提取到当前位置,复制得到的两个文件夹
features/
和plugins/
到安装目录。 - 具体配置等略过不谈,网上一大把。无非就是编码、补全、文字样式、注释和代码风格等。
项目管理:
Eclipse中每个Eclipse进程管理一个工作空间(WorkSpace),其中可以创建多个项目,每个项目可以添加多个包。工作空间根目录下会生成.metadata
目录保存工作空间相关配置,每个项目目录下也会生成项目文件。
Eclipse基本调试操作:
Ctrl+Shift+B
添加移除断点Ctrl+F11
开始运行F11
开始调试F5
单步跳入,能跳入(语句有函数调用)就跳入,不能就下一条语句Ctrl+F5
单步执行选择,能跳入就跳入,不能就不执行F6
单步跳过,下一条语句F7
单步跳出,跳出这个函数执行(只执行完这个函数调用,回到调用语句)F8
继续,执行到下一个断点Ctrl+F2
终止调试Ctrl+R
运行至行Ctrl+Alt+B
跳过所有断点,也就是无效化所有断点Drop to Frame
拖放至帧(这什么破翻译,真就直译?),跳转到当前执行函数的开头开始执行,不会改变一个全局数据原有的值,只是切换了栈帧。- 跳过、跳出、运行至行等能够运行多行代码的操作执行过程中遇到断点都会断住。
- 首选项,调试,单步执行过滤,过滤不需要关注的类。
- 配合调用堆栈(位于调试窗口)、本地变量监视、条件断点、表达式求值,常用的调试操作也就这些了。
其他提高效率的快捷键:
Ctrl+O
右键快速大纲,用于搜索当前文件中的字段或者方法以快速跳转Ctrl+F3
显示当前符号的快速大纲Ctrl+T
右键快速类型层次结构,显示派生层次结构F3
转到一个符号的声明Ctrl+F
查找符号Ctrl+Shift+G
搜索当前工作空间所有该符号引用位置Alt + ->/<-
代码浏览位置跳转Ctrl+H
搜索,有精细的搜索选项,类型、方法、包等。Ctrl+Shift+R
文件搜索Alt+Shift+R
重命名符号Ctrl+Shift+F
格式化当前文件的编码风格- IDE内运行终端:
Ctrl+Alt+Shift+T
说实话有些快捷键实在是有点太啰嗦,一点都起不到快捷的作用,说的就是Alt+Sift+Q
加上一个键的那一堆,也懒得自己改,不要增加太多心智负担,记住常用的就好。如Ctrl+O
, F3
, Ctrl+T
,加上常用的查找和调试快捷键就行。快捷键的使用必须要能够方便到在两秒钟内定位到想要的某个类、方法、文件、某个符号的所有引用、某个类的派生结构层次才算是舒服。
Eclipse导入第三方库:
- 右键项目,属性,Java构建路径,库,类路径(就是
classpath
),添加外部JAR,选择JAR添加之后即可导入到该项目中。然后在包资源管理器中src
、JRE系统同级的引用的库中就有这个库了。并且这个库的路径是绝对路径。 - 也可以在项目中新建文件夹,然后将
jar
文件复制到这个目录中,右键选中该jar,构建路径,添加到构建路径后同样会被加入到引用的库中,此时jar
被加入到了项目中,如果删除文件夹会移除依赖,库的路径是以相对路径保存的。或者类路径右边选择"添加JAR"就是添加项目内的Jar
路径。
启用预览特性:
- 右键项目,属性,Java编译器,取消JDK一致性,并勾选
Enable preview features for Java 15
。并且可以设置警告等级。
Eclipse多个包或者多个入口管理:
- 多个包同时存在都有入口时,在某个包含合法入口
main
的文件Ctrl+F11
运行即执行当前入口。如果当前文件没有入口,那么执行上一个配置。 - 在学习或者测试时可以给每个需要测试的类写一个
public static void main
,然后在当前文件编写并执行测试。 - Ctrl+F11运行时会自动创建运行配置,也可以项目右键,运行方式,运行 配置,Java应用程序,新建配置进行新建。或者右键项目或者包,属性,运行/调试设置。
- 上一个对话框中
Show Command Line
即可看到当前配置执行时的命令行。例:C:\eclipse\plugins\org.eclipse.justj.openjdk.hotspot.jre.full.win32.x86_64_15.0.1.v20201027-0507\jre\bin\javaw.exe -Dfile.encoding=UTF-8 -classpath "C:\Users\tch\Desktop\LearnJava\JavaStarted\bin" -XX:+ShowCodeDetailsInExceptionMessages Test.Main
- 要更改命令行的公共参数可以在窗口,首选项,Java,已安装的JRE找到对应JRE,编辑修改默认VM参数。
- 可以写多个入口的确很舒服,甚至可以互相调用。
使用自己安装的JDK而不是Eclipse自带的:
- 同样在窗口,首选项,Java,已安装的JRE,添加,标准VM,找到安装的JDK目录,添加自己安装的JRE环境而不是用Eclipse默认的。设置为默认后创建新项目时选择使用默认JRE作为编译环境即可。
- 修改已有项目的JRE环境:右键项目,属性,Java构建路径,库,模块路径找到JRE,编辑,修改为工作空间缺省JRE即可跟随首选项里面的默认JRE变化。
- Eclipse自带了JRE,最终执行结果都是一样的,一般来说也不需要改。
使用Eclipse导出jar包:
- 包资源管理器中选择包右键导出->Java->JAR文件,选择要导出的一个或多个包,填写入口类,即可出。
- 不设置其他选项的话,导出的清单文件中也就只有版本和入口类的信息。
- 当然还可以导出其他文件,清单文件也可以有很多其他配置内容,尚不清楚,有需求再了解。
IDEA分为旗舰版和社区版,免费的社区版相比旗舰版阉割了不少功能,比如Profiling Tools,Spring/Java EE等框架,HTTP客户端,前端编程语言支持,数据库相关,Kubernetes等。旗舰版有30天实用。刚开始可以用社区版,但要开发Web和企业应用还得旗舰版,个人授权旗舰版$149/Year,Jet Brains全家桶捆绑包$249/Year。
安装中文插件: 插件商店搜索Chinese,安装Chinese (Simplified) Language Pack / (中文语言包)。
项目管理:
新建项目,选择Java模块,会自动检测添加到path的JDK,也可以添加JDK选项选择其他版本JDK。项目文件存放在.idea
目录中。
在IDEA中没有工作空间的概念,只有Project和Module的概念,分别对应于Eclipse的WorkSpace和Project。所以一个IDEA窗口只能管理一个项目,如果要打开多个项目,需要打开多个窗口。一个项目可以有多个模块。
第一次新建模块时会需要创建新项目,模块不需要一定放在项目目录下(类似于VS的解决方案和项目),但最好将模块放在项目目录下,并且是子目录中,而不是项目根目录。然后打开项目之后再次新建模块就会默认在项目目录下的模块同名子目录了。模块文件.iml
。
然后模块下可以新建Package,Package中新建class/interface/enum/annotation/record,总体感受上和Eclipse差不多。只是Eclipse由项目管理自己的生成文件,而IDEA由项目管理所有模块的生成文件,生成文件保存在Project_Dir/out/production/moduleName/package/XXX.class
。
文件菜单,项目结构,打开项目结构窗口,可以修改项目、模块、库、JDK等一系列设置。比如项目默认JDK、语言级别、输出目录;模块名称、源文件夹、模块JDK版本;添加新的JDK等。
可以用不同视图:项目、包、项目文件等视图观察当前项目。
引入第三方库:
运行与调试:
Shift+F10/F9
运行/调试当前配置
Alt+Shift+F10/F9
选择配置并运行/调试
Alt+Shift+F5
附加到进程
常用快捷键:
导出jar包:
public class Hello
{
public static void main(String[] args)
{
System.out.println("hello,world");
}
}
从hello,world!可以看出来的细节:
- 语句以
;
结尾。 - 类似C#以某个类的静态main函数为入口,
main
的参数不同于C/C++,没有命令参数个数,因为数组可以确定大小。
- 类名必须以英文字母开头,后接字母,数字和下划线的组合。
- 习惯以大写字母开头。
- 注释
/** */
,/* */
,//
同C++,多行注释/** */
需要写在类和方法的定义处,可以用于自动创建文档:/** * comments for javadoc */ public class HelloWorld { }
- 整型:只提供带符号类型
byte
:1个字节short
:2个字节int
:4个字节long
:8个字节
- 浮点:IEEE-754标准浮点数,同C
float
:4个字节double
:8个字节
- 字符:UniCode字符
char
:2个字节
- 布尔:取值
true
和false
。boolean
:大小取决于JVM实现,底层不提供。
字面值后缀:
long
: L/lfloat
: F/fdouble
: D/d
从byte/short/char–>int–>long–>float–>double
可以自动进行隐式转换,反过来如果是窄化转换则必须使用强制转换。
强制类型转换:
(targetType)variable
, 同C风格,而不是C++风格,表达式需要加括号。- 可以进行窄化转换:
- 浮点转整型,会将小数部分丢掉,如果超过表示范围,则返回整型最大值。
- 整型窄化转换直接截断,因为没有无符号类型,少了很多转换问题。
变量作用域:
- 和其他语言一样。
- 局部变量和函数参数作用于块作用域
{}
。 - 类成员作用于类作用域。
- 不存在全局变量,也就不存在全局作用域。
- 里层作用域符号覆盖外层作用域同名符号定义。
- 算术运算:
+
-
*
/
%
+=
-=
*=
/=
%=
++
--
同样有前置和后置的区别,同C。 - 关系运算:
>
>=
<
<=
==
!=
- 逻辑运算:
&&
||
!
(&&
||
短路求值) - 按位运算:
&
|
~
^
- 移位运算:
>>
<<
算术移位,>>>
不考虑符号位逻辑右移,有无符号右移但没有左移,支持<<=
>>=
。 - 三元运算:
? :
。
类型自动提升:
- 整型运算:计算结果为较大类型的整型。
- 整型与浮点运算:结果提升至浮点型。
- 注意在复杂运算中,就算最终结果是浮点,但其中两个整数的运算不会出现自动先提升为浮点。同所有语言一样,适当位置
*1.0
先提升为浮点保证结果正确。
溢出:
- 溢出同样不会报错,需注意。
- 整型除0会报错。抛出
java.lang.ArithmeticException
- 浮点除0不会报错,会返回一些特殊值:
NaN
表示Not a Number
, 如0.0/0.
0,(3/0.0) / -(3/0.0)
Infinity
表示无穷大,如3/0.0
。-Infinity
表示负无穷大,如-3/0.0
。- 实际上很少出现。
字符char
:
- 常量使用
''
- 保存一个UniCode字符
- 可以用
\uXXXX
来表示 - 转义
\"
\'
\\
\n
\r
\t
\uXXXX
字符串:
String
- 字面值:
""
- 可以用
+
连接字符串和其他任意数据类型,连接前会先将其他数据类型转换为字符串 - 多行字符串:前面的共同空格会被去掉,取最短的。
""" 就这就这? 不会吧?不会吧? """
- 字符串是引用类型,可以指向一个空值
null
。类似于表示它是空指针,不指向任何值。空字符串和null
当然是有区别的。引用类型指向一个值,基本类型持有一个值,非常好理解。
- 创建后大小即固定,也就是指向的那个数组大小就固定,但是可以将其指向新的数组。
- 数组下标越界将引发运行时错误,抛出
java.lang.ArrayIndexOutOfBoundsException
异常。 - 初始化时直接指定元素值,则编译器会自动推导大小:
int[] A = new int[] {1,2};
,初始化时必须指定大小或者提供初始值,两者选一者,不能同时存在,指定大小时初始化为默认值(整型0,浮点0.0,boolean
则是fals
, 引用null
)。可以进一步简写为int[] A = {1,2}
。 - 定义:
type[]
- 长度:
length
- 取成员:
[]
- for each:
for(type val : arr)
- 转换为
String
:Arrays.toString()
,输出[elem1, elem2, ..., elemLast]
,需要import java.util.Arrays;
- 排序:
Arrays.sort()
- 多维数组:
type[][]
,即是数组的数组,不要求每个元素统一大小。 - 多维数组转字符串:
Arrays.deepToString()
- 输出:
System.out.print
- 换行输出:
System.out.println
- 格式化输出:
System.out.printf
,占位符%d
十进制%x
十六进制%f
浮点数%e
科学计数法%s
字符串,%%
转义表示%
本身。详细信息见文档java.util.Formatter。 - 输入:
import java.util.Scanner;
public class Main {
public static void main(String[] args) {
Scanner scanner = new Scanner(System.in);
String sInputStr = scanner.nextLine(); // 下一行
int iNextInt = scanner.nextInt(); // 下一个输入解析为整数
}
}
很好理解,但也感觉很啰嗦,可能的确需要啰嗦才能好理解吧。
和C/C++如出一辙:同样,只有一条语句时{}
可以省略。
if (condition) {
}
else if (other-condition) {
}
else {
}
对引用变量==
判等时,含义是判断是否指向同一个对象。判断内容相等需要使用equals
方法。在java中,通常称函数为方法(mtthod),因为函数必定是某个类的成员,不管是不是静态。
众所周知,浮点数不要直接判等,通常判断差值是否在精度范围内。
switch
语句: 同C,不赘述,可以使用整型、枚举。不同的是java中String
也可以作为switch
的判断条件,这就很方便了。因为C/C++其实并没有语法层面的字符串抽象类型。
switch (option) {
case 1:
System.out.println("Selected 1");
break;
case 2:
System.out.println("Selected 2");
break;
case 3:
System.out.println("Selected 3");
break;
}
语法糖:case -> statement;
执行结束退出,不需要break
。Java12开始。
并且还可以直接返回一个值:
double d = switch (i) {
case 1 -> 1.0;
case 2 -> {
System.out.println("i is 2");
yield 10; // switch statement return to 10
}
default -> 100;
};
switch (i) {
case 1 -> System.out.println("i is 1");
default -> System.out.println("i is not 1");
}
如果有多种情况,中间还有语句执行,还可以用{}
包起来,执行多个语句后用yield
返回,就像定义一个函数那样。
算是一个语法糖,完全可以找到等价的写法替代。
while(condition) {
}
do {
}
while(conditon);
for (init; condition; update conuter) {
}
for (type val : valArr) { // iterate iterable type, like array([])/String/etc.
}
同样可以用break
/continue
。
public class Main {
public static void main(String[] args) {
System.out.println(Arrays.toString(args));
}
}
命令行执行java Main.java hello world
,则传递给main
的参数args
为["hello", "world"]
。
不同于C++,Java中称数据成员为字段(field),称成员函数为方法(method)。
- 关键字:
class
- 指代对象自身:
this
引用变量 - 引用类型: 创建类对象实例都是使用引用变量来使用,可以理解为指向堆区域对象的指针,但是毕竟java没有指针(但的确有一个与空指针语义相同的
null
),也就没有解引用和直接在栈上实例化的操作。C++通过多重指针、指针引用等可以精确控制一个对象的生存周期,持有关系等任何行为。 - 单从语义上理解java的引用和C++非常像,不同的是java中可以更改引用指向的对象,还可以指向
null
,就像是C++指针和引用的融合一样。 - 构造方法(Constructor): 无返回值,当然不定义的话编译器会生成一个函数体为空的无参默认构造方法,定义之后便不再生成默认构造。光凭想象就可以想到不用管理内存之后相比C++会少掉多少考虑拷贝构造、移动构造、赋值运算符这类的事情,瞬间好像就轻松起来了。
- 默认构造时各种类型默认值: 不同于C++如果不给初始化,对于没有构造函数的内置类型(整型浮点指针),分配内存之后那块区域里面存什么值,成员就会是什么值。java中理所当然会执行默认初始化,引用初始化为
null
,数值类型用默认值0
,boolean
则是false
。 - 初始化:java可以直接在类内成员定义时给初始值。执行顺序理所当然是先初始化为字段默认值或定义时给定的值,然后再执行构造方法。
class Person {
private String name; // 默认初始化为null
private int age = 10; // 初始化为10
private double weight = 50; // 最终初始化为构造函数中给的值
public Person(double weight) {
this.weight = weight;
}
}
- java中没有类似C++中构造函数初始化列表这种东西。所以初始化就两个途径:给初始值、构造函数中赋值。
- 调用其他构造:
this(args);
,必须放在当前构造的第一条语句。 - 调用基类构造:
super(args);
- 除了构造函数之外,从各种意义上我们都需要有一个析构函数,因为不需要管理内存,好像析构存在的意义就没有那么大了。但用不用另说,必须有是确定的。java中扮演这个角色的就是
void finalize()
方法。- 但其实如果去看
Object.finalize
的注释的话,上面会说,这个方法从Java9就已经废弃了,原因是这个机制在本质上存在问题。如果在finalizer
中出现错误,可能会导致资源泄漏、线程/进程挂起、死锁、造成性能问题。而且如果没有必要也无法取消,析构时机和顺序也无法保证。这我这直接好家伙!那你这保证了个啥? - 作为替代:那些持有了并非是普通的堆内存资源但是需要释放的,都应该提供方法来显式释放资源,如果合适的话应该实现
AutoCloseable
接口。java.lang.ref.Cleaner
和java.lang.ref.PhantomReference
提供了更灵活和高效的对象用完后释放资源的方法。具体怎么用什么场景用还需要进一步探究。
- 但其实如果去看
- 访问权限:
public
private
protected
- 默认,不写访问修饰符
- 用在类、方法或者字段上。
- 思考与探索:有没有类似于C++中
=default
,=delete
那种显式使用或者禁用默认构造/=
运算符的语法呢?
- 可变参数:
- 定义:
void mthod(type ... args)
- 调用:
method(arg1, arg2, arg3)
- 当然这要求所有参数同类型,和C中通过
va_list
加上一个显式或隐式的参数个数来实现的方式有区别 - 最终
args
被解释为一个数组,同类型可变参数完全可以使用数组来传递,但是需要调用时显式构造数组,并且可以传递null
为参数,可变参数算是一个还不错的语法糖。
- 定义:
- 方法重载(Overload):
- 同C++一致的是,方法重载只与参数列表(类型和顺序)有关,和返回值,访问修饰符无关系。C++中函数重载之后其实就是成为了不同的函数,经过名称修饰之后符号是不同的。那么java有没有类似于名称修饰一类的东西呢?是如何保证调用时正确跳转到对应的函数入口地址的呢?这可能需要后续了解了字节码之后才能知道。
- 重载函数返回值类型和访问修饰符不必相同,这是理所当然的。
- 问题来了:可变参数类型参数算作数组还是多个参数呢?和重载混合在一起如何工作?如何判断调用哪一个?
- 答案是如果一个调用即匹配有可变参数的版本也可以匹配无可变参数的版本。那么优先调用无可变参数版本。如果同时匹配了两个有可变参数的版本,那么会存在歧义编译错误。也就是只有无可变参数优先于有可变参数,都有可变参数的话优先级相同。这样的重载如果不尝试去调用则并不会报冲突。
public class Person {
private String name;
public void setName(String ... args) {
StringJoiner joiner = new StringJoiner(" ");
for (String s : args) {
joiner.add(s);
}
name = joiner.toString();
}
public void setName(String firstName, String ... otherName) {
StringJoiner joiner = new StringJoiner(" ");
joiner.add(firstName);
for (String s : otherName) {
joiner.add(s);
}
name = joiner.toString();
}
public void setName(String firstName, String lastName) {
name = firstName + " " + lastName;
}
@Override
public String toString() {
return "Person: " + name;
}
public static void main(String[] args) {
Person p = new Person();
p.setName("Mary", "Jane"); // call setName(String firstName, String lastName)
p.setName("Mary", "Jane", "King"); // java.lang.Error
p.setName("Mary"); // java.lang.Error
System.out.println(p);
}
}
- 默认参数:
- 根据已知信息,并不存在这种东西,请通过方法重载来实现。
public void method(type1 v1, type2 v2) { } public void method(type1 v1) { method(v1, default_v2); }
- 也是,不然和可变参数混在一起编译器估计必然要凌乱,也减少心智负担,挺好。
- 提前总结所有关键字:
class
extends
Object
implements
super
protected
sealed
permits
final
intanceOf
@Override
- 语法:
class Student extends Person
- 根类:
Object
,没有父类的类都会自动继承Object
。 - 继承方式仅有一种,不像C++一样还有私有保护公有继承,虽然我从来未在工作中碰到过私有和保护继承就是了,无用的东西都可以剃掉,好耶!
- java不像C++一样可以多继承,也就是一个类只能有一个基类。一般来说的确是如此呢!这样的话类的继承关系就会是一棵真正的树,不会有多个基类。
- 其实也可以变相的多继承:
class C implements A,B
。只是A
和B
必须是接口(interface
)。 - 调用基类构造:
super(args);
,也即是用super
指代这个对象中的基类部分。引用父类字段或者方法时使用。 - 当然子类不会继承父类所有构造函数,不写的话默认构造是编译器生成,此时调基类的默认构造,即等价于在构造函数第一行添加
super();
,如果基类没有默认构造,那么是编不过的。 - 访问限定:和C++的公有继承如出一辙,子类无法访问父类
private
,可以访问protected
和public
。 - 不要在派生类中定义和基类字段同名的字段。当然并非语法上禁止,只是工程实践中不要这么做比较好,子类作用于会覆盖基类作用域,然后局部方法作用域会覆盖类作用域,你总可以使用
this.val
、super.val
来区分它们。在C++允许多继承所以使用baseclass::val/baseclass::func
。 - 如果在一个很长的继承链条里面都定义了同名的字段(当然这是很脑残的行为),因为只有
super
和this
可以指代父类对象和当前对象引用,而没有可以代表父类的父类对象的引用。如果没有定义同名字段,this.val
是从父类继承而来,那么就等同于super.val
。当然在实践中一般还是创建getter
和setter
调方法而不是直接操作父类字段比较好。 - 阻止继承:
sealed
配合permits
关键字只允许指定的类继承该类,public sealed class Shape permits Rect, Circle, Triangle
,这个操作有点意思。 - 使用
final
修饰类表明该类不能再被继承。同C++。final calss A extends B
。 - 类型转换:向上转换必然成功,向下转换如果类型匹配则可以成功,不匹配则会失败抛异常,很好理解。
- 判断是否是指定类型:
instanceof
,返回boolean
,完全匹配的类型或者基类都会返回true
。RTTI有了,好耶!语法层面支持真棒!C++某些时候还要自己去实现RTTI就很烦了(小声说其实C++也有原生的半吊子的RTTI就是了)。- 用法:
obj instanceof Type
,返回boolean
。 - Java14开始:
obj instanceof Type s
,返回boolean
。且可直接使用转换后的变量s
。默认配置本地Eclipse/Java SE15上显示preview feature and disabled by default
?见0.3 基本Eclipse使用。
- 用法:
- 继承与组合:is与has的关系要区分清楚当然不用多说,has关系不应该用继承。
- 覆写(Override):
- 在C++中,只有虚函数可以重写,和重载一样,判断是否是覆写的标准依然是函数参数列表(方法签名)。如果重写了一个并非虚函数的函数,那么也就不能称之为重写,非虚函数不会在虚表中,也就不会有多态,调用指针/引用/变量类型在编译期就确定了到底调用哪一个。
- 在Java中,所有函数皆是虚函数,其实也就是没有虚函数的概念,所有普通函数皆可以被重写。除非显式使用
final
阻止重写,不然都可以重写,使用了final
再在子类中重写会编不过。如果是方法签名相同但返回值不同的重写,当然会报错。 @Override
放在方法前,可以让编译器帮助检查是否进行了正确的覆写。如果是重写,但是方法名写错了,就会报错,如果不加,那么就会有基类方法和子类接口写错的方法同时可用。懂了,防呆设计!怪不得都说Java可靠性高,新手不容易犯错。当然,这是非必须的。- 看起来并没有那种能够在子类重写父类同名方法但又能使其不具有多态性的行为。这不是废话吗?
- java中不能在栈中实例化对象,所以都取决于运行时类型就是了,运行时是什么类型,就调那个类型的方法,可能是重写的基类方法,也可能是继承自基类的方法,总之是运行时类型所决定,当然要能够编过,那必然要编译时类型能够调用该方法才行。也就是说要使用基类重写的方法,需要是用这个基类方法重写自的那个类或者派生链条中间的类的引用。总感觉我在说一堆废话。
- 根类
Object
重要方法:toString
,将对象输出为String
。equals
,两对象判等。貌似并没有重写operator==
这种选项(因为根本就不支持运算符重载呀),看来C++的确自由度要更高那么一点点,当然心智负担也要高那么亿点点。对引用变量来说,==
就是判断是否指向同一个对象,也就是保存的地址是否相等。hashCode
,计算对象哈希值,java赛高!
- 子类调用基类方法:
super.method
。 - 字段加
final
之后表示在第一次初始化(字段赋初值和在构造函数中初始化两者选其一)之后便不能更改。有点像C++const
成员,只能在构造函数初始化列表中赋值,或者C++11之后的类内初始值。
- 声明:
abstract
同时用于类和方法。放在类返回值前和class
前。方法也就称之为抽象方法。 - 抽象类无法实例化,和C++抽象类同样的,还是类,也可以有成员,也可以有构造、被派生。当然也不能多继承,抽象类的修为还不够,需要舍弃血肉,灵魂飞升变为接口后才可以被多继承。
- 面向抽象编程:尽量引用顶层抽象类或接口,不关心具体子类型。本质:
- 上层代码只定义规范。
- 不需要子类就可以实现业务逻辑。
- 具体的业务逻辑由不同的子类实现,调用者并不关心。
- 定义了抽象方法的类必须定义为抽象类。不实现抽象方法的话,子类依然是抽象类。
- 抽象类可以没有抽象方法,但同样无法直接实例化。但可以通过匿名类(见后文)实例化:
abstract class Animal {
String name;
public static void main(String[] args) {
Animal p = new Animal() {};
}
}
- 关键字:
interface
。 - 对标C++的纯虚类,当然C++允许多继承,所以纯虚类和普通抽象类并无太大区别,可以构造、可以有成员。但java只有接口类允许多继承,那么当然就不能由只有一个的基类引用
super
来完成构造,那么必然就不能有正常属于普通类对象的字段和构造。 - 其实写了构造也能编过,会被识别为一个普通方法提示缺少返回值,而不是构造。写了字段也没有问题,貌似被当做了静态字段来处理。别说细节还挺多。经过求证接口的字段会自动
public final static
。 - 实现接口时,需要使用
implements
关键字。 - 同时派生一个类,并实现接口:
class A extends B implements C,D
。super
将指代B
,没有B
的话就是默认的Object
。 - 接口是可以允许类似菱形继承这种继承方式的,因为没有字段就不需要考虑多份数据怎么存存几份怎么取这种问题了。
default
方法:接口中也可以有实现了的方法,此时就需要加default
关键字,当然没有字段可以给它访问。目的是实现没必要在所有子类中重写的接口,派生类中可以不进行重写。所以其实接口和类的区别就只有是否有字段和构造这一点是吗?- 接口中所有方法默认
public abstract
,不需要显示写出。 - 接口可以继承另一个接口,同样使用
extends
。 - 最后接口这个词,正常来说应该是表示纯虚类,上层的抽象出来的和实现类相对的没有数据的抽象类。但工作里面感觉好多人都用接口来表示函数,比如在这个类里面加一个接口这种说法。最后Java里面有人说函数吗?都是说方法吗?字段会说成成员吗?说实话从C++切换过来什么都还好还是有点不适应名词变了。
- 属于整个类,并不属于某个实例,所有实例都可以使用。
- 通过
className.staticFieldOrMethod
来访问,当然也可以通过aInstance.staticFieldOrMethod
访问,等价于前者,但最好使用类名来访问,更加清晰。这点与C++是相同的。 - 静态方法无法使用
this
变量,只能访问静态字段。 interface
是可以有静态字段的,并且只能是final
的。所以编译器会自动为interface的字段加上public final static
。- 常用于工具类辅助类等。
- Java中使用Package来解决名称冲突,因为不同的人写的代码是完全可能出现名称重复的。C++中则是使用
namespace
,但是C++的namespace
仅仅是加了一层作用域而已,仅用于解决名称冲突问题。而java的包功能则更多。 - 调用方式:
Package.class
。 - 声明:
package packageName;
,必须写在程序有效代码第一行。 - 虚拟机运行时,JVM只看完整的类名,只要包名不同,类就不同。包可以是多层结构,用
.
隔开,类似于java.util
。 - 包不存在任何父子关系,所以
java.util
和java.util.zip
是不同的包。C++的namespce也可以嵌套,而且是有关系的。 - 不使用包名,那么就是使用默认包,类似于使用全局作用域。
- Java中包还要求和目录层次完全统一,不然就是语法错误。生成的
.class
也会是同样的结构。由衷感叹java真省心啊! - 在一个类中引用了其他类时,可以使用完整包名,也可以使用
import
将包中的类导入进来。类似于C++中的using namespace XXX;
。 import
用法:- 导入一个包所有
class
:import package.*;
- 导入一个类:
import package.XXXclass;
- 导入一个类中的所有静态字段和方法:
import static pacakge.class.*;
,使用较少。这样引入甚至可以引入同一个包的其他类中的静态方法,和引入其他包一样,包名不能省略。
- 导入一个包所有
- Java编译器最终编译出的
.class
只使用完整类名,编译器遇到一个类名时如果是完整类名,直接根据完整类名查找这个class
。如果是简单类名按照以下查找顺序进行查找:- 当前包中查找。
- 导入的包中查找。
java.lang
包查找。- 还无法确定类名就报错。
- 编写一个类时,编译器默认做的事情:
- 默认自动导入当前包所有类。
- 默认自动导入
java.lang.*
。但像java.lang.reflect
这种其实和java.lang
不是一个包,也没有父子关系,还是需要手动导入的。
- 不同包中两个类有相同的类名,都导入就会名称冲突,因为包没有嵌套这个说法所以最多只能导入其中一个,另一个需要写完整类名。
- 要移动一个文件所在的包时,IDE都会自动完成文件操作,还提供一键更新引用这种操作,可以说很方便了。
- 相比C++的继承自C的原始的头文件包含方式、头文件宏定义保护防止重复包含、接口实现分离、交叉引用、前向声明,java可以算的上很方便了。
- 命令行编译多个包多个源文件:在
src
目录下编译到bin
目录下。
javac -d ../bin ming/Person.java hong/Person.java mr/jun/Arrays.java
- 最佳实践:
- 推荐包名命名方法:使用倒置的域名。如:
org.apache
org.apache.commons.log
- 注意类命名不要和
java.lang
包重名。不要使用类名:String
Runtime
System
... - 也不要和JDK常用类重名:
java.util.ArrayList
java.math.BigInteger
...
- 推荐包名命名方法:使用倒置的域名。如:
总览:
修饰符\能否访问\访问位置 | 本类 | 同一个包的类 | 继承类 | 其他包的类 |
---|---|---|---|---|
private |
Yes | No | No | No |
无(默认) | Yes | Yes | No | No |
protected |
Yes | Yes | Yes | No |
public |
Yes | Yes | Yes | Yes |
-
访问修饰符限定了访问作用域
-
public
public
的类和接口可以被其他任何类访问。public
的方法和字段可以被其他类访问,前提是能访问类。
-
private
private
字段和方法无法被其他类访问,仅类内可以访问。- Java支持嵌套类,嵌套的类也在类内,也可以访问该类的私有字段和方法。
-
包作用域/默认作用域
- 包作用域的类和方法、字段可以被同一个包内的类访问。
- 一个包不可访问另一个包内默认作用域的类、字段或方法。
-
protected
protected
字段和方法可以派生类访问。protected
字段和方法包内同样可见。- 需要注意子类和父类不在同一个包时:
- 在实例方法中可以通过
this
或者super
来访问父类的protected
实例方法。 - 但在子类静态和实例方法中都不能通过父类引用(引用一个新
new
出来的子类或者父类对象)来访问父类的protected
实例方法。如果是使用子类引用则可以访问。【因为编译时应该是按照引用类型的访问修饰符来确定访问权限的】算是一个没什么卵用的小细节。 - 静态
protected
方法则在子类中均可访问。
- 在实例方法中可以通过
-
private
和protected
不能用来修饰类,但可以用来修饰嵌套类。一个最外层的非嵌套类只能用public
/final
/abstract
修饰。或者不用public
包内使用。 -
在子类中重写实例方法时可以扩展访问限定符:
- 也就是可以从
protected
扩展到public
。 - 同一个包内的话也可以将默认访问扩展到
protected
或者public
。 - 不能在子类重写时减低访问范围。目的很明显,确保我能用父类引用访问的方法,用子类引用都能够访问。
- 也就是可以从
-
最佳实践:
- 不确定是否需要
public
,就不声明为public
。 - 把方法定义为
package
权限有助于测试,因为测试类和被测试类只要位于同一个package
,测试代码就可以访问被测试类的package
权限方法。可以用于包内不用来公开的内部实现类。
- 不确定是否需要
-
一个java类只能有一个
public
类,有public
类时文件名必须和类名相同。没有时则不要求。
-
内部类(Inner Class)
class Outer { class Inner { } }
- Inner类实例不能单独存在,必须依附于一个Outer的实例。
public class Main { public static void main(String[] args) { Outer outer = new Outer("Nested"); // 实例化一个Outer Outer.Inner inner = outer.new Inner(); // 实例化一个Inner inner.hello(); } } class Outer { private String name; Outer(String name) { this.name = name; } class Inner { void hello() { System.out.println("Hello, " + Outer.this.name); } } }
- 要实例化一个Inner,我们必须首先创建一个Outer的实例,然后调用
Outer
实例的new
来创建Inner 实例。因为Inner Class除了有一个this
指向它自己,还隐含地持有一个Outer Class实例,可以用Outer.this
访问这个实例。所以,实例化一个Inner Class不能脱离Outer实例。 Outer
类被编译为Outer.class
,而Inner
类被编译为Outer$Inner.class
-
匿名类(Anonymous Class)
- 不需要在Outer Class中明确地定义这个Class,而是在方法内部,通过匿名类(Anonymous Class)来定义。
public class Main { public static void main(String[] args) { Outer outer = new Outer("Nested"); outer.asyncHello(); } } class Outer { private String name; Outer(String name) { this.name = name; } void asyncHello() { Runnable r = new Runnable() { @Override public void run() { System.out.println("Hello, " + Outer.this.name); } }; new Thread(r).start(); } }
Runnable
是一个接口,asyncHello
方法内new
的时候定义了一个没有类名的匿名类重写了run
方法,重写run
接口之后实例化并给了r
。Outer
类被编译为Outer.class
,而匿名类被编译为Outer$1.class
,如果有多个匿名类,那么被编译为Outer$2.class
etc- 除了接口外,匿名类也完全可以继承自普通类。
- 匿名类相对来说还比较常用。
-
静态嵌套类(Static Nested Class)
- 和Inner Class类似,但是使用
static
修饰,称为静态内部类。 - 用static修饰的内部类和Inner Class有很大的不同,它不再依附于Outer的实例,而是一个完全独立的类,因此无法引用
Outer.this
,但它可以访问Outer
的private
静态字段和静态方法。 - 就是一个独立的类,只是有Outer Class的private访问权限。
- 果然我觉得这才比较正常,像内部类,一个类依赖于一个对象感觉有一点点奇怪,暂不清楚应用场景。
public class Outter { public static void main(String[] args) { Outter.Inner inner = new Outter.Inner(); inner.hello(); } static class Inner { public void hello() { System.out.println("hello, static nested class"); } } }
- 和Inner Class类似,但是使用
- classpath是什么?
- JVM用到的一个环境变量,它用来指示JVM如何搜索class。
- 因为Java是编译型语言,源码文件是
.java
,而编译后的.class
文件才是真正可以被JVM执行的字节码。因此,JVM需要知道,如果要加载一个abc.xyz.Hello
的类,应该去哪搜索对应的Hello.class
文件。 - 设定方法
- 系统环境变量中设置
classpath
环境变量,不推荐,会污染整个系统环境。 - 启动JVM时设置
classpath
变量,推荐。启动时添加-classpath
或者-cp
选项,添加;
分割的路径作为参数(Windows中,linux中用:
分割)。
- 系统环境变量中设置
- IDE中运行时,自动传入的
-cp
参数就是工程bin
目录和引入的jar
包。 - JVM不依赖classpath加载核心库,不需要将核心库的路径传入classpath。
- 更好的做法是,不要设置
classpath
!默认的当前目录.
对于绝大多数情况都够用了。
- 如果有多个
.class
文件,散落在各层目录中,肯定不便于管理。如果能把目录打一个包,变成一个文件,就方便多了。 jar
包就是用来干这个事的,它可以把package组织的目录层级,以及各个目录下的所有文件(包括.class
文件和其他文件)都打成一个jar
文件。jar
包实际上是一个zip格式的压缩包文件,jar包相当于目录。执行一个jar包里的class,就可以把jar包放到classpath中。
java -cp ./hello.jar abc.xyz.hello
-
因为
jar
包就是zip文件,所以直接将bin
目录中的目录和文件压缩成zip
文件,更改后缀为.jar
就算制作成功了一个jar
包。值得注意的是,bin
目录不应该被包含到压缩包的路径中。 -
jar
包还可以包含一个特殊的/META-INF/MANIFEST.MF
文件,MANIFEST.MF
是纯文本,可以指定Main-Class
和其它信息。JVM会自动读取这个MANIFEST.MF
文件,如果存在Main-Class
,我们就不必在命令行指定启动的类名,而是用更方便的命令:java -jar hello.jar
。 -
举例来说,如果写了两个包一个
Main
一个Hello
,编译后bin
目录下生成了两个目录Main/
和Hello/
,选中这两个目录,zip格式压缩到文件Main.jar
,文件名无关紧要。执行时:java -cp ./Main.jar Main.Main
。jar文件位置随意,路径给对就行,包中的类名随意,只要你定义了public static main
即可执行。没有这个类或者依赖了其他类但是打包时没有加进去则解释执行时JVM会抛出java.lang.ClassNotFoundException
。 -
一个包中可以有多个类有
public static main
方法,甚至可以互相调用。执行时通过参数指定想执行哪一个就执行哪一个。 -
清单文件
- 如果没有
jar
包中/META-INF/MANIFEST.MF
,那么是不能通过java -jar
来执行的。 - 清单文件中定义了许多内容,但不必全部关心。
- 手动创建清单文件:注意最后要有一个空行。
Manifest-Version: 1.0 Main-Class: package.mainClass
只要给出入口类
Main-Class
就可以通过java -jar file.jar
来执行了。 - 如果没有
-
使用Eclipse导出
jar
包:- 包资源管理器中选择包右键导出->Java->JAR文件,选择要导出的一个或多个包,填写入口类,即可导出。
- 不设置其他选项的话,导出的清单文件中也就只有版本和入口类的信息。
- 当然还可以导出其他文件,清单文件也可以有很多其他配置内容,尚不清楚,有需求再了解。
-
命令行创建jar包命令:更多选项查看
jar -h
帮助,首先cd
到.class
文件根目录。jar -c --file target.jar --main-class YourMainClass .\package\*.class
-
到这里只能说,Java的确很方便。无论是项目配置,编译,执行,依赖配置,打包发布都如此简单方便。怪不得是时下最流行的编程语言。
-
你永远可以通过增加一个中间层来解决一些问题。永远可以通过减少一个中间层来提升一些性能。
-
现在这个时代,硬件性能已经普遍强大到绝大部分情况下我们并不需要去抠一个程序是到底是多占了几个字节的内存还是多执行了几条指令。愉快地开始java之旅吧!
-
最后,JVM是世界上最好的虚拟机!
.class
是JVM看到的最小执行文件,jar
包就是.class
的容器。但写一个大型程序时是可能需要依赖其他第三方的jar包的。最后执行时就需要将所有jar放在一起来执行,少了或者写漏了某个jar就可能会抛出ClassNotFoundException
。java -cp 1.jar;2.jar;...;last.jar package.mainClass
- 引入了模块解决依赖的问题。如果
a.jar
依赖b.jar
,那我们应该给a.jar
加点东西说明这个信息。让程序编译运行时自动定位到b.jar
,这种自带依赖关系的class
容器就是模块。始于Java 9。 - 创建模块:与创建Java项目一致,在
src/
目录一级下创建module-info.java
文件,即是模块描述文件。文件内容类似与下面这样:使用module
和requires
说明模块和依赖。
module hello.world {
requires java.base; // 可不写,任何模块都会自动引入java.base
requires java.xml;
}
module-info.java
经过编译后会在bin
下生成module-info.class
。- 下一步把
bin
目录所有class
文件打包成jar
。使用jar
命令。 - 模块还可以导入导出。使用
jmod
命令从jar
生成模块。 - 模块要能够访问另一个模块的类,除了访问限定符支持,还需要在目标模块导出外部能访问的类:
module Hello.World {
exports hello.world;
...
}
- 在包之外,模块又进一步隔离了代码的访问权限。
- 更详细的理解和说明:TODO。
String
是一个引用类型,本身也是一个class,Java编译器对String
有特殊处理,可以直接用字符串字面值"string-literal"
来表示,每一个字符串字面值底层都被实现为一个String
实例。- 实际上字符串内部是通过字符数组来表示,这点很多编程语言应该都是一样的。
- Java字符串的重要特性就是不可变,内部保存字符串的字段是
private final
的字符数组,赋值后即不可变。String
类中没有实现任何修改这个数组的方法。使用Eclipse的话F3到定义里面可以看到其实是一个字节数组private final byte[] value;
,并不是char[]
。 - 用字符串字面值创建就相当于使用字符数组创建。java的语法层面支持使我们可以简写。
String s = "yes";
String s2 = new String(new char[] {'y', 'e', 's'});
- 对字符串判等应该用
equals
方法,如果使用==
则是判断两个字符串引用变量是否引用同一个对象。 - 忽略大小写判等:
equalsIgnoreCase
- 搜索提取子串的接口:
idnexOf
lastIndexOf
startsWith
endsWith
substring
- 下标从0开始,遗憾的是不支持像数组一样使用
[]
来引用字符串中的字符。可能是因为不允许改变的原因。还是说因为内建的字符类型不支持引用,就算获取了也无法设置,没有理由提供语法层面支持。获取某一个字符使用public char charAt(int index)
。 - 修改字符串的所有操作都不改变原字符串内容,而是返回新字符串。
- 去除收尾空字符:
trim()
,返回去除后的新字符串。包括\t
\t
\n
\0
。 stricp()
也是去除首位空字符,在trim()
基础上还会去除像\u3000
中文空格这样的字符。只移除首或尾:stricpLeading
stripTrailing
- 判空:
isEmpty
- 判断是否是空白:
isBlank
- 替换:
replace
- 分割:
split
- 拼接:
join
- 格式化:
formatted
format
- 将任意类型转换为
String
:valueOf
- 转换为
char[]
:toCharArray
- 字符编码:
- java的
String
和char
在内存中总是用UniCode表示。 - 可以调用
String
的方法手动将字符串转换为其他编码,结果为byte[]
String s = "你好,世界!"; printBytes(s.getBytes()); // 系统默认编码,最好不要这么写 printBytes(s.getBytes(StandardCharsets.UTF_8)); printBytes(s.getBytes(StandardCharsets.UTF_16)); printBytes(s.getBytes(StandardCharsets.UTF_16BE)); printBytes(s.getBytes(StandardCharsets.UTF_16LE));
- java的
- 进入到
String
的声明里面可以看到内部是怎么存储一个字符串的,早期可能会直接使用char
数组,但那样的话对于只有ASCII字符构成的字符串内存空间明显不够友好,现在都是用字节数组并且内部有区分编码,但可以发现都是final
修饰的,也就是赋值之后即不可变。而我们在外部不需要关心String
内是怎么存储的。
public final class String
implements java.io.Serializable, Comparable<String>, CharSequence,
Constable, ConstantDesc {
private final byte[] value;
private final byte coder; // 0 - LATIN1(即ISO-8859-1,单字节,向下兼容ASCII), 1 - UTF16
// ...
}
StringBuilder:频繁编辑字符串,位于java.lang
- Java字符串赋值之后即不可变,对字符串的编辑的操作都返回一个新的字符串,指向新的内存,如果需要对字符串频繁编辑,那么频繁构造也就会频繁分配内存,也会影响GC效率。所以Java标准库提供了
StringBuilder
,它是一个可变的对象,编辑操作改变自身,而不是新构造对象。 - 看看它都有些什么方法:
compare
append
delete
replace
insert
indexOf
lastIndexOf
resverse
toString
都是一些字符串应该有的操作,都有不同参数的重载,操作完之后使用toString
得到字符串。
StringBuilder sb = new StringBuilder(2048);
sb.append(100).append(',').append(" your princess!");
sb.insert(3, "%");
sb.replace(0, 3, "99");
sb.delete(sb.length()-1, sb.length());
System.out.println(sb.toString());
- 总感觉参数的含义怪怪的,不是很好用的感觉。
- 因为编辑操作修改自己,并返回
this
,所以可以连起来调用。
StringJoiner:用来高效拼接字符串,位于java.util
- 能用的方法不多:
public StringJoiner(CharSequence delimiter, CharSequence prefix, CharSequence suffix)
public StringJoiner setEmptyValue(CharSequence emptyValue) // 为空时的默认值
public String toString() // 转字符串
public StringJoiner add(CharSequence newElement) // 添加
public int length() // 长度
public StringJoiner merge(StringJoiner other) // 合并
- 这也能单独实现为一个类是我没有想到的。
- 简单来说就是把基本类型如
boolean
byte
short
int
long
float
double
char
等类型变为引用的手段。 - 为
int
定义包装类:类似于这样包装一层之后就可以将其当做对象来用。
class Integer {
private final int value;
public Integer(int value) {
this.value = value;
}
public int intValue() {
return value;
}
}
- java核心库
java.lang
为每种基本类型都定义了包装类型,分别为Boolean
Byte
Short
Integer
Long
Float
Double
Character
- 可以
new
包装对象传数值对象来创建,但会提示从java 9开始就弃用了,会有Warning。正常用应该用类似于Integer.valueOf(int n)
这种静态方法来创建。 - 提供了很多操作:与字符串的互相转换,解析,比较,进制转换,该类型的常量边界值,编码等。其中大部分是静态方法,感觉的确还是有点用的。
- 将
Integer.valueOf()
这种方法成为静态工厂方法,创建新对象时应该优先选择静态工厂方法,而不是new
运算符。看一下实现可以知道某些情况下会返回缓存的实例而不是new
的新实例。
public static Integer valueOf(int i) {
if (i >= IntegerCache.low && i <= IntegerCache.high)
return IntegerCache.cache[i + (-IntegerCache.low)];
return new Integer(i);
}
- 包装也成为装箱(Boxing),自动装箱和自动拆箱都是在编译器完成的,装箱拆箱会影响执行效率,且拆箱是可能会
NullPointerException
。 - 包装类型比较应该使用
equals
,整数和浮点数的包装类型都继承自Number
。
Java中,很多时候为了封装,都会这样去写一个类:
- 若干
private
字段。 - 通过
public
方法去读写实例字段。
如果读写方法符合以下的命名规范,那么这种类被称为JavaBean
,其中的字段是xyz
。
// 字段
private Type xyz;
// 读方法getter
public Type getXyz()
// 写方法setter
public void setXyz(Type value)
通常将读方法(getter
)和写方法(setter
)称之为属性(property
)。
- 只写
getter
的属性称为只读(read-only)属性,比较常见。 - 只有
setter
的属性称为只写(write-only)属性,不常见。 - 属性是一种通用叫法、实践约定,不是语法规定,本质上其实就是一个方法。
作用:
- 用来传输数据,把一组数据组合成一个
JavaBean
来传输。 - 方便被IDE分析,直接生成读写属性的接口。就不需要自己来慢慢写了。Eclipse中,右键->源码->生成getter和setter,选择要生成属性的字段和读写接口,访问修饰符等就可以直接生成了。
使用java.beans
提供的Introspector
可以枚举出一个JavaBean
的所有属性。
public static void main(String[] args) throws IntrospectionException {
BeanInfo info = Introspector.getBeanInfo(Person.class);
for (PropertyDescriptor pd : info.getPropertyDescriptors()) {
System.out.println(pd.getName());
System.out.println("\t" + pd.getReadMethod());
System.out.println("\t" + pd.getWriteMethod());
}
}
因为可能抛异常所以最后声明中必须加上throws
语句,不然会报错,异常暂时没有了解,后续详解。其中的class
字段是继承自Object
而来。得到的结果中对于class
字段有一个只读属性:public final native java.lang.Class java.lang.Object.getClass()
。
Introspector
称之为内省,使用方法一般是:
内省(IntroSpector)是Java 语言针对 Bean 类属性、事件的一种缺省处理方法。一般的做法是通过类
Introspector
的getBeanInfo
方法来获取某个对象的BeanInfo
信息,然后通过BeanInfo
来获取属性的描述器(PropertyDescriptor
),通过这个属性描述器就可以获取某个属性对应的 getter/setter 方法,然后我们就可以通过反射机制来调用这些方法,这就是内省机制。
当然现在还未接触反射,后续详解。
要用常量时,java暂时没有const
(预留关键字,但还没有使用),定义局部常量的话使用final
即可。定义全局常量的话定义为static final
就行,使用时ClassName.staticFinalVar
这样来用就行。某些时候要做判断时,无法通过编译器来检查值的合理性,当然这时候枚举就必须要有了。
枚举类定义:
enum WorkingState {
coding, testing, takeABreak, slacking, drinkingCoffee, watchingVideos, playingGame, snapping
}
- 比较枚举值是编译器会进行类型检查,确保了枚举值的有效性。不同类型的枚举不能互相比较或者赋值。
enum
是引用类型,比较值时应该使用equals
方法,但是由于enum
类型的所有常量在JVM中只有一个实例,所以使用==
比较也不会有问题。
if (state == WorkingState.coding) {
state = WorkingState.takeABreak;
}
enum
和class
有什么区别呢,答案是本质上没有区别,只是具有几个特点:
- 定义的
enum
总是从java.lang.Enum
派生,且无法比继承。 - 只能定义
enum
的实例,而无法通过new
运算符创建实例。 - 定义的每个实例都是引用的该枚举类型的唯一实例。
- 可以用于
switch
语句。
编译后得到的class
类似于这样:
public final class WorkingState extends Enum { // 继承自Enum,标记为final class
// 每个实例均为全局唯一:
public static final Color coding = new WorkingState();
public static final Color testing = new WorkingState();
public static final Color takeABreak = new WorkingState();
// ...
// private构造方法,确保外部无法调用new操作符:
private WorkingState() {}
}
每个枚举的值都是class
的一个实例,所以可以使用一些从Enum
继承而来的方法:
WorkingState state = WorkingState.coding;
String s = state.name(); // 获取枚举名称:coding
int order = state.ordinal(); // 获取枚举常量定义的顺序(从0开始):0
可以为枚举定义自己的构造,字段和方法。例如自己定义枚举的值:因为enum
就是class
,所以定义enum
常量时可以调用自己的构造。要加字段建议声明为final
因为你也没办法new
一个enum
去改它。
enum Weekday {
MON(1), TUE(2), WED(3), THU(4), FRI(5), SAT(6), SUN(0);
public final int dayValue;
private Weekday(int dayValue) {
this.dayValue = dayValue;
}
}
默认情况下toString
方法会返回和name
一样的值(也就是是这个枚举常量的名称),但是是可以重写实现自己的toString
的,目的一般在于使输出更具可读性。所以如果要判断枚举常量的名字,应该始终使用name
。
不变类:
- 定义时使用
final
,无法派生子类。 - 每个字段使用
final
,保证创建实例后无法修改任何字段。 - 为了保证不变类比较,还需要重写
equals
和hashCode
方法。这样才能在集合类中使用。
这样写起来很繁琐,所以语法糖又来了。java14开始,引入了Record
类,使用关键字record
:
public record Point(int x, int y) {}
上述定义改写为class
后类似于:
public final class Point extends Record {
private final int x;
private final int y;
public Point(int x, int y) {
this.x = x;
this.y = y;
}
public int x() {
return this.x;
}
public int y() {
return this.y;
}
public String toString() {
return String.format("Point[x=%s, y=%s]", x, y);
}
public boolean equals(Object o) {
...
}
public int hashCode() {
...
}
}
啊这,java的繁琐真是不无道理呢!
和Enum
类似,不能人为的从Record
派生,只需要使用record
关键字由编译器来处理就行。
- 简单来说,
record
就是为了定义纯数据载体类。 - 可以添加自己的静态方法。
- 可以给一个Compact Constructor添加逻辑。
- 一种典型静态方法就是
of
方法,实现静态工厂,用来创建新对象。Point p = Point.of(1, 2)
这样写还是挺方便的。
public record Point(int x, int y) {
public Point { // 没有参数列表,赋值的逻辑由编译器负责补全
if (x < 0 || y < 0) {
throw new IllegalArgumentException();
}
}
public static Point of() {
return new Point(0, 0);
}
public static Point of(int x, int y) {
return new Point(x, y);
}
}
java15版本中,这好像还是preview feature:
- 打开编译开关:
--source 15 --enable-preview
才能使用,不然会报错。 - Eclipse中右键项目,属性,Java编译器,勾选
Enable preview features for Java15
才能使用。并且会有警告You are using a preview language feature that may or may not be supported in a future release
。
Java提供的原生类型中表示范围最大的整型是64为整型long
,和其他任何语言中一样,内置类型计算一般来说都可以由CPU指令直接提供支持,基本上一条指令就可以搞定。但是表示范围超过了64位的范围,那么就必须自己造轮子实现高精度整数了,用空间和时间来换表示范围和精度。
java提供了高精度大整数实现:java.math.BigInteger
。其中用int[]
数组来模拟大整数,做算术运算时需要通过调用其方法来实现,编译器没有提供运算符支持。这时候就不得不提一句C++的运算符重载了。
定义:
public class BigInteger extends Number implements Comparable<BigInteger>
- 继承自
Number
- 不可变对象。
方法:
- 构造:任意进制
public BigInteger(String val, int radix)
,十进制public BigInteger(String val)
,字节数组public BigInteger(byte[] val, int off, int len)
,静态工厂public static BigInteger valueOf(long val)
,等。 - 比较操作
public int compareTo(BigInteger val) // return -1, 0, 1 - less, equal, greater
public boolean equals(Object x)
public BigInteger min(BigInteger val)
public BigInteger max(BigInteger val)
- 算术运算:尚未列完全,该有的都有了,加减乘除、相反数、取余求模、开方乘方、绝对值、位运算。
public BigInteger add(BigInteger val)
public BigInteger subtract(BigInteger val)
public BigInteger multiply(BigInteger val)
public BigInteger divide(BigInteger val)
public BigInteger[] divideAndRemainder(BigInteger val)
public BigInteger remainder(BigInteger val)
public BigInteger pow(int exponent)
public BigInteger sqrt()
public BigInteger gcd(BigInteger val)
public BigInteger abs()
public BigInteger negate()
public int signum()
public BigInteger mod(BigInteger m)
public BigInteger shiftLeft(int n)
public BigInteger shiftRight(int n)
public BigInteger and(BigInteger val)
public BigInteger or(BigInteger val)
public BigInteger xor(BigInteger val)
public BigInteger not()
- 转换为算术类型:
// 超过表示范围将丢失高位信息
public int intValue()
public long longValue()
public float floatValue()
public double doubleValue()
// 超过表示范围抛异常
public long longValueExact()
public int intValueExact()
public short shortValueExact()
public byte byteValueExact()
- 其他转换
public byte[] toByteArray()
public String toString(int radix)
public String toString()
对应于高精度整数,必然也应该有高精度浮点数。java.math.BigDecimal
可以表示一个任意大小且精度完全准确的浮点数。
定义:
public class BigDecimal extends Number implements Comparable<BigDecimal>
- 继承自
Number
- 不可变对象。
方法:
- 构造和算术运算都和
BigInteger
差不多就不列除了。区别是都有包含指定保留小数位数与舍入规则的参数的重载版本。 public int scale()
用来表示小数位数。如果小数点后只有0那么会返回负值。public BigDecimal setScale(int newScale)
设置小数位数,精度会丢失时按指定方法舍入或截断。public BigDecimal stripTrailingZeros()
去除末尾0。
比较:
equals
会比较scale,如果值相等scale不等,则也会不等。- 忽略scale比较:
public int compareTo(BigInteger val)
,返回值-1,0,1。一般来说比较应该用compareTo
而不是equals
。
实现:通过一个表示每一位值的大整数,和一个表示小数位数的scale
实现。
public class BigDecimal extends Number implements Comparable<BigDecimal> {
private final BigInteger intVal;
private final int scale;
}
数学计算:
-
java.lang.Math
类提供了大量静态方法来执行常见的数学运算,比如指数、对数、开方、三角函数、取整舍入、绝对值、最大值,还定义了常见的常数(e
PI
)。 -
很多时候它的实现是直接调用
java.lang.StrictMath
,他们的关系是: 在Math
类中,为了达到最快的性能,所有的方法都使用计算机浮点单元中的例程。如果得到一个完全可预测的结果比运行速度更重要的话,就应该使用StrictMath
类。它使用“Freely Distributable Math Library”实现算法,以确保在所有平台上得到相同的结果。有关这些算法的源代码请参阅 fdlibm,都是常用数学函数的C实现。 -
简单来说就是因为存在浮点计算误差,不同平台(如x86和ARM)计算结果不能不一样(指误差不同),
StrictMath
保证所有平台计算结果一致,而Math
会针对平台优化计算速度。大部分情况使用Math
就足够了。 -
java.lang.*
是默认导入的,但因为是静态方法,所以还是要在调用时加上Math.
。如果不想要在调用时加上Math.
,那么如前所述导入Math
类的所有公有静态字段和方法即可:import static java.lang.Math.*;
伪随机数:
java.util.Random
包可用于生成伪随机数:所谓伪随机数,是指只要给定一个初始的种子,产生的随机数序列是完全一样的。- 要生成一个随机数,可以使用
nextInt()
、nextLong()
、nextFloat()
、nextDouble()
。 - 都是非静态方法,要生成随机数需要构造一个
Random
实例。
Random r = new Random();
System.out.println(r.nextInt());
System.out.println(r.nextDouble());
System.out.println(r.nextLong());
- 可以使用一个随机数种子作为参数构造
Random
对象,不给种子的话就会采用系统时间戳作为种子。也可以通过public synchronized void setSeed(long seed)
设置种子。 - 可以生成的随机数类型包括:
int
long
float
double
Math.random
其实也是调用了内部的Random
实现的。
真随机数:
有伪随机数,就有真随机数。实际上真正的真随机数只能通过量子力学原理来获取,而我们想要的是一个不可预测的安全的随机数,SecureRandom
就是用来创建安全的随机数的
SecureRandom sr = new SecureRandom();
System.out.println(sr.nextInt(100));
SecureRandom
无法指定种子,使用RNG(random number generator)算法。JDK的SecureRandom
实际上有多种不同的底层实现,有的使用安全随机种子加上伪随机数算法来产生安全的随机数,有的使用真正的随机数生成器。实际使用的时候,可以优先获取高强度的安全随机数生成器,如果没有提供,再使用普通等级的安全随机数生成。
public class Main {
public static void main(String[] args) {
SecureRandom sr = null;
try {
sr = SecureRandom.getInstanceStrong();
} catch (NoSuchAlgorithmException e) {
sr = new SecureRandom();
}
byte[] randomBuffer = new byte[64];
sr.nextBytes(randomBuffer);
System.out.println(Arrays.toString(randomBuffer));
}
}
SecureRandom
的安全性是通过操作系统提供的安全的随机种子来生成随机数。这个种子是通过CPU的热噪声、读写磁盘的字节、网络流量等各种随机事件产生的“熵”。在密码学中,安全的随机数非常重要。如果使用不安全的伪随机数,所有加密体系都将被攻破。因此,时刻牢记必须使用SecureRandom
来产生安全的随机数。
- 需要使用安全随机数的时候,必须使用
SecureRandom
,绝不能使用Random
! - 这里要提一句java的异常处理感觉很舒服,处理成本不高,如果调用了一个可能抛出异常的函数,那么就一定需要处理这个异常,可以向上抛出,也可以就地处理。并且IDE会给提示,不处理是不能编过的。而对于C++,抛异常要考虑的事情就多了,资源和内存的释放,接到了异常之后能否恢复正确的上下文继续执行?太多需要考虑的事情,而对于内存用光、下标越界这种事也不会去考虑,让其崩溃然后修BUG也许是更好的选择。就我个人在实践中C++的异常处理用的不算多,更多的实践是返回一个错误码。
插播一小节闲话,分析一下BigInteger
的实现:
BigInteger
源码分析:
- 包声明和导入:主要是异常、IO、数组、随机数、数学、以一些不知道的东西。
package java.math;
import java.io.IOException;
import java.io.ObjectInputStream;
import java.io.ObjectOutputStream;
import java.io.ObjectStreamField;
import java.util.Arrays;
import java.util.Objects;
import java.util.Random;
import java.util.concurrent.ThreadLocalRandom;
import jdk.internal.math.DoubleConsts;
import jdk.internal.math.FloatConsts;
import jdk.internal.HotSpotIntrinsicCandidate;
import jdk.internal.vm.annotation.Stable;
import jdk.internal.vm.annotation.ForceInline;
- 声明:
public class BigInteger extends Number implements Comparable<BigInteger>
- 基类
Number
:抽象类,可以和java原始类型byte
short
int
long
float
double
互相转换的类型的基类。派生中应该实现这些转换方法。
package java.lang;
public abstract class Number implements java.io.Serializable {
public Number() {super();}
public abstract int intValue();
public abstract long longValue();
public abstract float floatValue();
public abstract double doubleValue();
public byte byteValue() {
return (byte)intValue();
}
public short shortValue() {
return (short)intValue();
}
@java.io.Serial
private static final long serialVersionUID = -8742448824652078965L;
}
- 字段、常量
final int signum; // 表示符号,取值-1,0,1,表示负数,0,正数
final int[] mag; // 表示值,大端序存储,0元素表最大量级
private int bitCountPlusOne; // 比特位之和+1
private int bitLengthPlusOne; // 比特位长度+1
private int lowestSetBitPlusTwo;
private int firstNonzeroIntNumPlusTwo;
尚未开始分析好吧,TODO。
为什么要有异常?
- 错误不可避免:未获取到资源,用户错误操作,程序有BUG,随机错误等。
- 需要处理错误,使用错误码返回值来标识出现的错误处理太麻烦。
- Java语言层面上提供异常处理机制,用异常来表示错误。
异常是一种类,本身带有类型信息。可以在任何地方抛出,只需要在上层捕获,和方法调用分离,不需要返回一个错误码来标识错误。
使用try-catch
块来捕获与处理异常:
try {
// dosomething
// ok
} catch (FileNotFoundException e) {
// file not found:
} catch (SecurityException e) {
// no read permission:
} catch (IOException e) {
// io error:
} catch (Exception e) {
// other error:
}
java的异常是类,派生关系如图如下:
┌───────────┐
│ Object │
└───────────┘
▲
│
┌───────────┐
│ Throwable │
└───────────┘
▲
┌─────────┴─────────┐
│ │
┌───────────┐ ┌───────────┐
│ Error │ │ Exception │
└───────────┘ └───────────┘
▲ ▲
┌───────┘ ┌────┴──────────┐
│ │ │
┌─────────────────┐ ┌─────────────────┐ ┌───────────┐
│OutOfMemoryError │... │RuntimeException │ │IOException│...
└─────────────────┘ └─────────────────┘ └───────────┘
▲
┌───────────┴──────────────┐
│ │
┌─────────────────────┐ ┌─────────────────────────┐
│NullPointerException │ │IllegalArgumentException │...
└─────────────────────┘ └─────────────────────────┘
Throwable
有两个子类:Error
和Exception
,Error
表示较为严重的错误,程序一般无法处理,比如:
OutOfMemoryError
内存用尽NoClassDefFoundError
类定义未找到StackOverflowError
栈溢出
而Exception
是运行时的错误,可以被捕捉并处理。某些异常是程序处理的一部分,比如:
NumberFormatException
数值类型的格式错误FileNotFoundException
未找到文件SocketException
读取网络失败
某些异常是错误的程序逻辑导致的,应该修复程序。比如:
NullPointerException
对某个null
的对象调用方法或字段IndexOutOfBoundsException
数组索引越界
Java规定:
- 必须捕获的异常,包括
Exception
及其子类,但不包括RuntimException
及其子类。这种类型的异常称为Checked Exception。必须捕捉也就是说编译器会强制调用方对异常进行处理,不然会直接编译报错。 - 不需要捕获的异常,包括
Error
及其子类,RuntimeException
及其子类。也成Unchecked Excetion。
当然编译器并不强制要求程序捕获RuntimeException
,但是否捕获应该视程序逻辑而定,具体情况具体分析。
- 捕捉异常:使用
try-catch
块。 - 抛出异常:
throws
语句,比如throws new XXException(args);
异常也是一个对象,也需要new
。
如果是Checked Exception,但是没有用try-catch
捕捉,那么必须在方法定义时,使用throw XXXException
表明该函数可能抛出某种异常,由上层调用者来处理。
static byte[] stringToGBK(String s) throws UnsupportedEncodingException{
return s.getBytes("GBK");
}
此时就表明stringToGBK
可能抛出Checked Exception,调用者就必须处理:try-catch
或向上抛出,当然也可以使用try-catch
捕获到异常后再向上抛出。
从编译器层面保证了Checked Exception必定能够得到处理,当然有助于保证程序的健壮性,但同时也使程序变得啰嗦起来。
当然只捕获不处理也是行得通的,但那感觉就像把异常抛弃了一样的脱裤子放屁的作弊行为,并不值得推荐,至少应该将其记录下来,让人知道程序运行出现了什么问题,而不是发现了问题但包着拒不报告增加调试和纠错难度。程序并不只是为了运行而编写,程序首先是给人看让人理解的,其次才是给机器执行的。
打印异常栈:Throwable.printStackTrace()
方法。
使用try-catch
语句来捕获异常,可以使用多个catch
,每个catch
分别捕获一个Exception
的子类。捕获异常时从上到下匹配,匹配到后便不在继续,类似于if - else if - else
逻辑。最后只能由一个catch
语句能够被执行。
所以说catch
的顺序很重要,如果同时捕获的多个异常类具有派生关系,那么为了确保子类异常能够被捕捉到,就必须将其放在父类异常前面。
如果无论是否有一场发生,都希望能够执行一些语句,做一些清理工作,那么应该放到finally
中。
try {
// do try things
} catch (XXException e) {
// do XXexcetion things
} catch (Exception e) {
// do exception things
} finally {
// do finally things
}
关于finally
:
- 可写可不写,可选。
finally
总是最后执行。- 如果有异常被捕获,那么执行对应的
catch
,然后执行finally
,如果没有异常被捕获,那么try
语句执行完后直接执行finally
。 - 比较反直觉的一点是,如果在
catch
里面return
了,同样会执行fianlly
。并且如果return
返回了一个表达式,那么会先计算这个表达式的值,然后再去执行finally
中处理,然后返回原先计算得到的值,返回值是确定的,不会因为finally
中有可能造成表达式值修改的处理而改变了返回的值。搞清楚这点即可。 - 某些情况也可以没有
catch
,直接使用try ... finally
保证能够有一些抛出异常时同样能够得到执行的语句,并将异常继续往上抛。
甚至还可以合并多个类型的异常捕获:
try {
// do try things
} catch (XXXException | YYYException e) {
// do XXexcetion or YYYException things
} catch (Exception e) {
// do exception things
} finally {
// do finally things
}
如果他们做的事情很类似的话,可以合并,否则感觉也没有多大必要。那么问题来了,合并处理的时候,异常对象e
的类型是运行时才确定的吗?
异常的传播:
- 如果抛出的异常在调用层没有被捕获,那么异常会一致沿着调用者向上抛。直到被某一层的
try ... catch
捕获到。 try ... catch
可以嵌套,可以在try
语句块里面再去try ... catch
,如果没有里层catch
没有捕获到,会被抛到外层来由外层的catch
尝试捕获。- 可以通过基类的
Throwable.printStackTrace()
方法来打印出该异常传播的调用栈。从最底层抛出的那一层直到调用的最顶层。对于调试错误很有帮助,给出了源代码行号,可以直接定位。
java.io.UnsupportedEncodingException: unknown
at java.base/java.lang.StringCoding.encode(StringCoding.java:440)
at java.base/java.lang.String.getBytes(String.java:960)
at Main.Main.stringToEncode(Main.java:41)
at Main.Main.test(Main.java:22)
at Main.Main.main(Main.java:13)
- 如果在某一层捕获了异常,但重新
new
了一个新的异常像上抛出,那么这个新的异常打印调用堆栈时就会丢失原始异常的信息。为了能够追踪原始的异常栈,可以把捕获到的异常作为参数,构造新的异常。 - 作为参数传入的用来构造异常的原始异常会被保存在
Throwable.cause
字段中,通过Throwable.getCause()
方法获取到。 - 捕获到异常后,一定要保留住原始异常,以便定位最终的抛出位置。打印时你能够显示出原始异常信息。
java.lang.IllegalArgumentException: java.lang.NumberFormatException: For input string: "abc"
at Main.Main.test(Main.java:29)
at Main.Main.main(Main.java:13)
Caused by: java.lang.NumberFormatException: For input string: "abc"
at java.base/java.lang.NumberFormatException.forInputString(NumberFormatException. java:68)
at java.base/java.lang.Integer.parseInt(Integer.java:652)
at java.base/java.lang.Integer.parseInt(Integer.java:770)
at Main.Main.test(Main.java:24)
... 1 more
- 在
catch
中抛出异常,同return
一样不会影响finally
的执行,JVM会执行finally
再抛出异常。那如果在finally
抛出异常呢?那么既然是先执行finally
自然是先抛出finally
中的异常,catch
中要跑出的异常就被屏蔽了。 - 像上述描述那样如果有多个类型的异常需要抛出,但是由于只能抛出一个,怎么办呢?如果我们需要捕获所有的异常的话,方法是先用
origin
变量保存原始异常,然后调用Throwable.addSuppressed()
,把原始异常添加进来,最后在finally
抛出
static int test() throws Exception {
Exception origin = null;
try {
System.out.println(Integer.parseInt("abc"));
} catch (Exception e) {
origin = e;
throw e;
} finally {
Exception e = new IllegalArgumentException();
if (origin != null) {
e.addSuppressed(origin);
}
throw e;
}
}
最终打印出的异常信息会是这个样子的:两个异常的信息都会得到保留。感觉也同样可以将origin
作为参数用来构造新异常,但表示的含义应该有点区别:导致的关系与并列的关系?
java.lang.IllegalArgumentException
at Main.Main.test(Main.java:29)
at Main.Main.main(Main.java:13)
Suppressed: java.lang.NumberFormatException: For input string: "abc"
at java.base/java.lang.NumberFormatException.forInputString (NumberFormatException.java:68)
at java.base/java.lang.Integer.parseInt(Integer.java:652)
at java.base/java.lang.Integer.parseInt(Integer.java:770)
at Main.Main.test(Main.java:24)
... 1 more
通过Throwable.getSuppressed()
可以获取到所有的Suppressed Exception,结果是一个Throwable []
。绝大多数情况下,finally
中不需要抛出异常,通常也不需要关心Suppressed Exception,但需要知道可以这么用。
Java标准库常用异常:
Exception
│
├─ RuntimeException
│ │
│ ├─ NullPointerException
│ │
│ ├─ IndexOutOfBoundsException
│ │
│ ├─ SecurityException
│ │
│ └─ IllegalArgumentException
│ │
│ └─ NumberFormatException
│
├─ IOException
│ │
│ ├─ UnsupportedCharsetException
│ │
│ ├─ FileNotFoundException
│ │
│ └─ SocketException
│
├─ ParseException
│
├─ GeneralSecurityException
│
├─ SQLException
│
└─ TimeoutException
当我们要抛异常时,尽量使用标准库异常,然而在一个大型项目中,必然需要定义自己的异常。这是,保持一个合理的异常继承体系非常重要。
常见做法是定义一个根异常,然后所有异常类从其派生,实现的话可以参照标准库RuntimeException
:
package java.lang;
public class RuntimeException extends Exception {
public RuntimeException() {
super();
}
public RuntimeException(String message) {
super(message);
}
public RuntimeException(String message, Throwable cause) {
super(message, cause);
}
public RuntimeException(Throwable cause) {
super(cause);
}
protected RuntimeException(String message, Throwable cause,
boolean enableSuppression,
boolean writableStackTrace) {
super(message, cause, enableSuppression, writableStackTrace);
}
}
应该要提供多种构造方法,好像也就构造了,其他具体问题具体看。
派生于RuntimeException
,异常类的定义都出人意料的简单。
java语法层面没有指针的概念,指针当然源自于C,指针让使用者看见了地址,提供给使用去操作地址的手段,引用类型只是隐藏了内存地址让其对使用者不可见,但思想是完全相同的,并且使用起来更简单。java中还是能看见指针的影子的,比如打印一个引用变量的值就能够看到类似于地址的东西。
如果使用了一个值为null
的引用变量去调用它的非静态字段和方法,就会抛出NullPointerException
。当然使用空引用操作静态字段或方法就等价于直接用类去使用,和引用的值没有半毛钱关系,是可以的,只是一般来说也不会去这么用。
如果遇到了NullPointerException
,那么正确的处理应该是找到抛出的位置,添加判空处理,修正逻辑错误,而不是将其捕捉后隐藏错误或向上抛。至少在C++中,使用一个指针前先判空是常识性的东西,通过空指针去操作对象会直接导致崩溃。相信任何语言都是一样的,一个可用的程序它必须是健壮的,不应该有空指针异常这样的低级错误。
另一些避免该类问题的手段:当可以返回一个空字符串/空数组/其他空值或者返回一个null
时,构造一个空值返回可以避免一部分这类问题。但不管怎么说,使用一个可能为空的东西前都应该是要判空的,难道不是吗?
给JVM添加一个-XX:+ShowCodeDetailsInExceptionMessages
参数启用NullPointerException
的详细信息输出,说明是谁空掉了。在IDE里面一般是默认开启的。
Eclispe给JRE指定参数:window > preferences > java > Installed JREs > your JRE > edit > default VM arguments
。
语法:assert condition : "assertion message";
,其中的断言消息是一个字符串,可选。
断言失败,会抛出AssertionError
,程序结束退出,因此断言不能用于可恢复的程序错误,只应该用在开发和测试阶段。我的理解是断言只应该用在那种基本不会失败,一旦失败程序再执行下去就没有什么意义不如直接退出的地方,以帮助快速定位。
那么如何区分测试阶段和正式上线,不让断言影响到用户体验呢?C/C++的方法一般是通过宏定义在DEBUG版本中断言是正常语义,在Release版本中断言不做任何事情。所以断言内部不应该有会修改变量的操作,去掉断言不应该会改变程序逻辑。绝对不应该写出这样的语句:assert x++ > 0;
,当然这在任何语言中应该都是常识。
JVM默认关闭断言,遇到assert
语句直接就忽略了,要开启断言,需要给JVM传递-enableassertions
(简写-ea
)参数。还可以有选择的启用断言,比如参数-ea:Main.Main
就是对Main.Main
这个类启用断言,或者某一个函数也可以。
实际开发中,很少使用断言,更好的做法是编写单元测试。以我有限的C++开发经验来说,在一个复杂的大型程序中,断言除了在调试版本中让你的程序崩溃之外没有任何作用。
某些时候我们需要完整运行程序,而不是在调试环境下调试程序,但又想知道程序的详细运行状态。此时就需要知道一些中间过程执行情况,中间变量是否正确,这是可以怎么办呢?
最简单的方式就是通过System.out.println
打印我们需要输出的变量,但这样比较初级,也不好管理。如果想要更加详细的信息,那么可以实现一个日志系统,在程序中穿插日志的记录,日志记录不会影响也不应该影响程序的正常执行逻辑,只是记录程序的执行状态。并且可以设定输出样式、设置日志分级、重定向到文件等等功能。
Java当然考虑到了这些东西,所以提供了内置的日志包java.util.logging
,不需要我们来自己造轮子。
java.util.logging.Logger
类:
import java.util.logging.Logger;
LLogger logger = Logger.getGlobal();
logger.severe("a fatal error occurred...");
logger.warning("just a warining...");
logger.info("started...");
logger.config("config ...");
logger.fine("just fine...");
logger.finer("won't crash...");
logger.finest("work normally...");
打印信息中包含了时间,调用类和方法,输出信息:
3月 24, 2021 10:49:03 下午 Main.Main main
严重: a fatal error occurred...
3月 24, 2021 10:49:03 下午 Main.Main main
警告: just a warining...
3月 24, 2021 10:49:03 下午 Main.Main main
信息: started...
JDK的Logging
定义了7个日志级别,从严重到普通:
SEVERE
WARNING
INFO
CONFIG
FINE
FINER
FINEST
默认级别是INFO
,INFO
及以下的信息不会被打印出来。使用日志级别的好处在于可以调整级别就可以筛选和屏蔽调很多调试相关的日志输出。
局限:
- JDK的
Logging
系统在JVM启动时读取配置文件完成初始化,一旦开始运行main
方法,就无法修改配置。 - 配置不太方便,需要在JVM启动时传递参数
-Djava.util.logging.config.file=<config-file-name>
以重定向到文件。
好处:
- 可以存档以追踪问题,将一次程序的运行状况记录下来分析。
- 可以按级别分类,方别打开或关闭某些级别。
- 可以根据配置文件调整日志,无需修改代码。
TODO:使用参数-Djava.util.logging.config.file=<config-file-name>
重定向到文件无论是IDE还是命令行都可以执行,但都没有成功输出到文件,更多细节待以后有需要来补充。
Commons Logging是一个由Apache创建的第三方日志库,可以挂接不同的日志系统,通过配置文件指定挂接的日志系统。默认情况下自动搜索并使用Log4j,如果没有找到就再使用JDK Logging。
使用方法:
- 通过
LogFactory
获取Log
类实例,然后使用Log
实例来打印日志。
import org.apache.commons.logging.Log;
import org.apache.commons.logging.LogFactory;
public class Main {
public static void main(String[] args) {
Log log = LogFactory.getLog(Main.class);
log.info("start...");
log.warn("end.");
}
}
当然因为是第三方库,JDK里面是没有的,所以需要下载(下载地址,最新版本1.2)后添加到classpath
。
命令行编译执行:
- 将
commons-logging-1.2.jar
文件放在Main.java
同一个目录。 - 执行
javac -cp commons-logging-1.2.jar Main.java
编译得到Main.class
。 - 然后
java -cp .;commons-logging-1.2.jar Main
执行java程序。如果执行.class
时指定了classpath,那么应该将当前目录也作为classpath,不然会找不到主类Main
。注意classpth多个路径时Windows中使用;
分割,Linux和MacOS使用:
分割,Windows中如果在Powershell中执行,多个路径还要加上双引号包起来。 - 也可以跳过编译,直接执行java文件,
java -cp commons-logging-1.2.jar Main.java
。
Eclipse中导入第三方库见 0.3 基本Eclipse使用。
Common Logging定义了6个日志级别,默认级别是INFO
:
FATAL
ERROR
WARN
INFO
DEBUG
TRACE
Log
的使用:
- 如果在静态方法中使用
Log
,通常直接定义了一个静态成员给所有方法共用,使用LogFactory.getLog(Main.class)
获取Log
实例,只能在该类中使用。 - 如果是在实例方法中使用,通常定义一个实例变量,使用
LogFactory.getLog(getClass())
获取实例,这样做的好处时,由于多态的特性子类的getClass()
返回的是子类的类型,所以子类也可以直接使用该Log
实例。最好定义为protected
。 Log
接口(interface)对每种级别的日志都声明了两个重载的方法,接口名称和上面列出的级别一致:
void info(Object message)
void info(Object message, Throwable t)
第二个重载可以传入异常,用在catch
语句中很方便,结果除了输出message
之外,还会调用异常的printStackTrace
输出异常栈。
public static void main(String[] args) {
try {
throw new RuntimeException();
} catch (Exception e) {
log.error("exception occureed", e);
}
}
上面的Commons Logging可以作为“日志接口”来使用,而真正的“日志实现”可以使用Log4j。前面提到Commons Logging默认查找classpath
下的Log4j来作为日志实现,没有的话则会使用JDK Logging。
Log4j是一种非常流行的日志框架,当前最新版本2.14,下载地址,同样是Apache的。
Log4j是一个组件化的日志系统,架构如下:
log.info("User signed in.");
│
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐
├──>│ Appender │───>│ Filter │───>│ Layout │───>│ Console │
│ └──────────┘ └──────────┘ └──────────┘ └──────────┘
│
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐
├──>│ Appender │───>│ Filter │───>│ Layout │───>│ File │
│ └──────────┘ └──────────┘ └──────────┘ └──────────┘
│
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ ┌──────────┐
└──>│ Appender │───>│ Filter │───>│ Layout │───>│ Socket │
└──────────┘ └──────────┘ └──────────┘ └──────────┘
使用Log4j输出日志时,自动通过不同的Appender把日志输出到不同的目的地。
- console: 屏幕/控制台
- file: 文件
- socket: 通过网络输出到远端计算机
- jdbc: 输出到数据库
输出日志时可以通过Filter过滤哪些日志要输出,哪些不输出。例如仅输出ERROR级别的日志,最后通过Layout来格式化日志信息。例如自动添加日期、时间、方法名称等。
实际使用时,并不需要关心Log4j的API,而是通过配置文件来配置它。使用时,将一个Log4j2.xml
文件放到classpath
下就可以让Log4j读取配置文件并按照我们想要的输出方式输出日志。例子:
<?xml version="1.0" encoding="UTF-8"?>
<Configuration>
<Properties>
<!-- 定义日志格式 -->
<Property name="log.pattern">%d{MM-dd HH:mm:ss.SSS} [%t] %-5level %logger{36}%n%msg%n%n</Property>
<!-- 定义文件名变量 -->
<Property name="file.err.filename">log/err.log</Property>
<Property name="file.err.pattern">log/err.%i.log.gz</Property>
</Properties>
<!-- 定义Appender,即目的地 -->
<Appenders>
<!-- 定义输出到屏幕 -->
<Console name="console" target="SYSTEM_OUT">
<!-- 日志格式引用上面定义的log.pattern -->
<PatternLayout pattern="${log.pattern}" />
</Console>
<!-- 定义输出到文件,文件名引用上面定义的file.err.filename -->
<RollingFile name="err" bufferedIO="true" fileName="${file.err.filename}" filePattern="${file.err.pattern}">
<PatternLayout pattern="${log.pattern}" />
<Policies>
<!-- 根据文件大小自动切割日志 -->
<SizeBasedTriggeringPolicy size="1 MB" />
</Policies>
<!-- 保留最近10份 -->
<DefaultRolloverStrategy max="10" />
</RollingFile>
</Appenders>
<Loggers>
<Root level="info">
<!-- 对info级别的日志,输出到console -->
<AppenderRef ref="console" level="info" />
<!-- 对error级别的日志,输出到err,即上面定义的RollingFile -->
<AppenderRef ref="err" level="error" />
</Root>
</Loggers>
</Configuration>
虽然配置Log4j比较繁琐,但一旦配置完成,使用起来就非常方便。对上面的配置文件,凡是INFO级别的日志,会自动输出到屏幕,而ERROR级别的日志,不但会输出到屏幕,还会同时输出到文件。并且,一旦日志文件达到指定大小(1MB),Log4j就会自动切割新的日志文件,并最多保留10份。更多配置参见官方文档。
使用:下载后将下面三个jar
和配置文件Log4j2.xml
添加到classpath
:
log4j-api-2.x.jar
log4j-core-2.x.jar
log4j-jcl-2.x.jar
将这三个包添加到classpath之后还要保证Log4j.xml
在classpath根目录(也就是要放到Eclipse工程的bin/
目录下,或者命令行执行时放到生成.class
的根目录),这样就可以按照配置文件内容输出到日志文件。
总结:
- 通过Commons Logging输出日志,不用修改代码只需进行配置就可以使用Log4j。
- 使用Log4j只需要将jar和配置文件Log4j2.xml添加到classpth。
- 更换Log4j,只需要移除jar和Log4j2.xml。
- 扩展Log4j时才需要使用Log4j的接口,例如自己开发将日志加密写入数据库的功能。
- 当然其实也可以跳过Commons Logging这一层直接使用Log4j输出日志。
上面的Commons Logging和Log4j分别扮演日志API和日志实现的角色,搭配使用。同样的库还有SLF4J(API)和Logback(实现)。他们都是开源的第三方库,因为对Commons Logging的接口和Log4j的性能不满意,所以就分别有了SLF4J和Logback。
那么SLF4J相较Commons Logging有什么优势呢?
- 支持
logger.info("{},{}", str1, str2)
这样的字符串格式化。 - 还有呢?
事实上SLF4J的日志接口与Commons Logging几乎一波一样,对比:
Commons Logging | SLF4j |
---|---|
org.apache.commons.logging.Log |
org.slf4j.Logger |
org.apache.commons.logging.LogFactory |
org.slf4j.LoggerFactory |
就是Log
变成了Logger
,LogFactory
变成了LoggerFactory
。
配置SLF4J和Logback,需要下列三个jar包,目前使用的是SLF4J 1.7.9
和logback 1.2.3
:
slf4j-api-1.7.x.jar
logback-classic-1.2.x.jar
logback-core-1.2.x.jar
添加到classpath
,添加配置文件logback.xml
到classpath
根目录:
<?xml version="1.0" encoding="UTF-8"?>
<configuration>
<appender name="CONSOLE" class="ch.qos.logback.core.ConsoleAppender">
<encoder>
<pattern>%d{HH:mm:ss.SSS} [%thread] %-5level %logger{36} - %msg%n</pattern>
</encoder>
</appender>
<appender name="FILE" class="ch.qos.logback.core.rolling.RollingFileAppender">
<encoder>
<pattern>%d{HH:mm:ss.SSS} [%thread] %-5level %logger{36} - %msg%n</pattern>
<charset>utf-8</charset>
</encoder>
<file>log/output.log</file>
<rollingPolicy class="ch.qos.logback.core.rolling.FixedWindowRollingPolicy">
<fileNamePattern>log/output.log.%i</fileNamePattern>
</rollingPolicy>
<triggeringPolicy class="ch.qos.logback.core.rolling.SizeBasedTriggeringPolicy">
<MaxFileSize>1MB</MaxFileSize>
</triggeringPolicy>
</appender>
<root level="INFO">
<appender-ref ref="CONSOLE" />
<appender-ref ref="FILE" />
</root>
</configuration>
然后使用时替换为对应的类型和接口接口:
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;
public class Main {
public static void main(String[] args) {
Logger logger = LoggerFactory.getLogger(Main.class);
logger.info("start...");
logger.warn("end.");
}
}
总结:
- SLF4J和Logback可以取代Commons Logging和Log4j。
- 始终使用SLF4J的接口写入日志,使用Logback只需要配置,不需要修改代码。
知道大概用法即可,有需求时再去研究具体配置和细节用法。
除了int
等基本类型外,Java的其他类型都是class
,包括interface
。如Runable
、Object
、String
、Exception
等。
类这种东西是由Java在执行过程中动态加载的,那么Java是如何实现RTTI的呢?每加载一个类,JVM会为其创建一个Class
类实例,并将这个类和这个Class
实例关联起来。这个Class
类的定义大概是这样的:
public final class Class {
private Class() {}
}
在C++里面,如果我们要自己实现RTTI,其实也是这样来做的,具体做法大概是:
- 当有新的类被添加到继承体系结构时,新的
Class
对象被创建,并被加到派生关系树的对应位置(叶子节点),通过这个对象我们可以访问到他的所有直接与间接基类(向上遍历)。 - 每个类中使用一个静态数据成员保存该类对应的
Class
对象(指针),定义静态成员函数以获取到该指针。 - 每个类中再定义非静态成员函数(
getClass()
)转调上面的静态成员函数,这个非静态成员函数需要是从根类继承来的虚函数,在每个类中重写以返回自己的Class
对象,这是最关键的地方,通过该接口获取到对象真实类型的Class
对象即可实现运行时类型识别。 - 通常通过一个机制实现上面3个过程,一般来说就是写一个宏而已。典型的实现可以参考MFC(一个经典/过时的Windows界面库)。
- 一般来说还会允许用户自己从指定的基类派生实现的类也有这个特性,那么就需要对外公开上一步说的那个机制让用户来用,还需要提供能够使类型动态加载和卸载的机制,也就是动态地从类型树上删除或者添加节点的机制,一般作为静态函数实现在类中,在模块加载和卸载时做即可。
TODO:了解反射之后,可以尝试在C++上实现反射。
能够预想到,java从语言层面就实现了这个机制,那么就来看一下对应的功能是如何实现的:
Class
类构造是private
的,也就是说只有JVM能够来创建Class
实例。- JVM持有的每一个
Class
对象都对应一个数据类型(class
或interface
)。 Class
实例包含了该类的所有信息(String
为例):- 名称,
java.lang.String
- 包,
java.lang
- 基类,
java.lang.Object
- 接口,
java.io.Serializable
,Comparable<String>
,etc. - 字段,
value[]
,etc. - 方法,
String()
,length()
,etc.
- 名称,
这种通过该Class
实例获取到类的信息的方法称为反射(Reflection)。
那么要如何获取到一个类的Class
对象呢:
- 通过类的静态变量
class
获取:Class strClass = String.class
。因为class
还是定义类的关键字,所以这里是Java编译器做了特殊处理,不是简单地在定义在Object
类中的一个静态字段。在Object
定义中也是找不到class
字段的。 - 通过实例的
getClass()
方法获取,这个方法是定义在万物的基类Object
中的,因为内置类型不从Object
派生,所以没有这个方法可以调用。String s = "hello"; Class strClass = s.getClass();
- 如果知道一个
Class
实例的完整类名,可以通过静态方法Class.forName(String className) throws ClassNotFoundException
来获取:try { Class strCls = Class.forName("java.lang.String"); } catch (Exception e) { System.out.println("no such a class: java.lang.String"); }
注意获取类的Class
实例判等与isntanceOf
的区别,如果要求是同一个类型,后者可以是基类。
Class
定义:
public final class Class<T> implements java.io.Serializable,
GenericDeclaration,
Type,
AnnotatedElement,
TypeDescriptor.OfField<Class<?>>,
Constable
通过Class
对象获取类的基本信息:获取类名、去除包名后的简化类名、类型名、包、包名、基类、接口、字段、方法、判断是否是各种特殊的类型、通过类名得到对应Class
对象等,这里并未列全。
public String getName()
public String getSimpleName()
public String getTypeName()
public String getCanonicalName()
public Package getPackage() // If this class represents an array type, a primitive type or void, this method returns null
public String getPackageName()
public native Class<? super T> getSuperclass()
public Class<?>[] getInterfaces()
public boolean isAnonymousClass()
public boolean isLocalClass()
public boolean isMemberClass()
public Class<?>[] getClasses()
public Field[] getFields() throws SecurityException
public Method[] getMethods() throws SecurityException
public Constructor<?>[] getConstructors() throws SecurityException
public Field getField(String name)
public Method getMethod(String name, Class<?>... parameterTypes) throws NoSuchMethodException, SecurityException
public Constructor<T> getConstructor(Class<?>... parameterTypes) throws NoSuchMethodException, SecurityException
public boolean isEnum()
public boolean isRecord()
public native boolean isArray();
public native boolean isInterface();
public native boolean isPrimitive();
public boolean isAnnotation()
public boolean isSynthetic()
public static Class<?> forName(String className) throws ClassNotFoundException
public T newInstance() throws InstantiationException, IllegalAccessException
JVM为每一种基本类型进行了特殊处理创建了Class
对象,可以直接通过int.class
这种方式访问。但是对内置类型的变量,因为没有从Object
派生,所以是不能通过实例的getClass
方法来获取Class
对象的。
获取到一个类型的Class
对象之后,就可以用其来创建该类型对象:但是因为没有参数,所有只能调用无参构造函数。
try {
Class cls = Student.class;
Student s = (Student)cls.newInstance();
System.out.println(s);
} catch (Exception e) {
System.out.println(e);
}
如果传入的这个Class
对象对应的类没有无参构造,那么会抛出java.lang.InstantiationException
,如果无参构造无法访问或者使用的是Class
类对应的Class
对象,那么会抛出java.lang.IllegalAccessException
。其中做了特殊处理,况且Class
的无参构造是private
的。Class
对象只能由JVM在加载了新的类时来创建。
JVM并不会在一次性把所有用到的类加载到内存中(即是不会一次性创建所有Class
对象),需要程序执行过程中用到了一个新的类,才会把这个类加载到内存(也就是创建它的Class
对象)。这是JVM动态加载class
的特性。
因为动态加载特性,就可以用下面的函数来判断一个类是否存在,如果传入的类名在classpath
中存在那么就会返回true
,前面提到的Commons Logging判断Log4j是否存在就可以用这样的方法。
static boolean isClassPresent(String name) {
try {
Class.forName(name);
return true;
} catch (Exception e) {
return false;
}
}
我比较好奇的一点是Class
对象是如何创建的,用什么样的数据结构来存储的,JVM会如何管理。当然这个可能需要了解JVM的实现,TODO。
对任意的Object
,有了它的Class
对象,就可以获取这个它的一切信息。
public Field getField(String name)
根据字段名获取某个public的字段(包括父类和接口,找不到的话先按照声明顺序找接口,再找基类)public Field getDeclaredField(String name)
根据字段名获取当前类的某个字段,包括所有访问权限的字段(不包括父类和接口)public Field[] getFields()
获取所有public字段,包括所有基类和实现的接口,如果是内置类型或者数组对应的Class
实例,那么返回空数组public Field[] getDeclaredFields()
获取当前类定义的所有访问权限的字段,不包括基类和接口
Field
类型:
- 定义:
public final class Field extends AccessibleObject implements Member
public String getName()
获取字段名称public Class<?> getType()
获取字段类型的Class
对象public native int getModifiers();
获取字段修饰符,不同的bit表示不同含义public static final int PUBLIC = 0x00000001; public static final int PRIVATE = 0x00000002; public static final int PROTECTED = 0x00000004; public static final int STATIC = 0x00000008; public static final int FINAL = 0x00000010; public static final int SYNCHRONIZED = 0x00000020; public static final int VOLATILE = 0x00000040; public static final int TRANSIENT = 0x00000080; public static final int NATIVE = 0x00000100; public static final int INTERFACE = 0x00000200; public static final int ABSTRACT = 0x00000400; public static final int STRICT = 0x00000800;
获取字段的值:public Object get(Object obj)
,参数为需要获取字段的对象,返回值被装箱到Object
对象中,如果是内置类型,会自动包装为对应的包装类型。
如果在没有访问该字段权限的地方用了Field.get
那么可能会抛出IllegalAccessException
,如果非要访问,可以在前面加上public void setAccessible(boolean flag)
调用传入true
确保能够访问。setAccessible
是在从基类AccessibleObject
中继承而来的,Field
Method
Constructor
都直接或间接从其派生。
- 反射是一个非常规用法,使用反射,代码会很繁琐,使用反射会破坏对象的封装。
- 反射更多提供给工具或底层框架来使用,目的是在不知道目标实例任何信息的情况下,获取特定字段的值。
setAccessible(true)
可能会失败,如果JVM运行期存在SecurityManager
,那么它会根据规则进行检查,有可能阻止setAccessible(true)
。
设置字段值:public void set(Object obj, Object value)
静态实例的话get/set
的obj
参数会被忽略,自动为null
,建议写为null
,就像调用类的静态方法是最好用类名而不是用实例一样,只为让代码更清晰。
值得注意的是,反射相关类型位于java.lang.reflect
包内,与java.lang
不是一个包,不会自动导入,需要手动import
。
类似于访问字段,访问一个类的方法在Class
类中有如下方法:
public Method getMethod(String name, Class<?>... parameterTypes)
public,包括基类public Method getDeclaredMethod(String name, Class<?>... parameterTypes)
所有权限,不包括基类和接口public Method[] getMethods()
public,包括基类public Method[] getDeclaredMethods()
所有权限,不包括基类和接口
末尾的可变参数需要按顺序传入方法参数列表的Class
对象,为空就是无参版本。
Method
类型:
- 定义:
public final class Method extends Executable
public String getName()
public int getModifiers()
public int getParameterCount()
public TypeVariable<Method>[] getTypeParameters()
public Class<?> getReturnType()
public Class<?>[] getExceptionTypes()
见名知意,其中后面三个都还有一个Generic
的方法,getGenericParameterTypes
getGenericReturnType()
getGenericExceptionTypes()
返回值类型为Type
,也就是Class
实现的其中一个接口。这三个方法表示得到参数列表、返回值、异常的正式类型。
使用反射调用方法:
public Object invoke(Object obj, Object... args)
第一个是对象实例,后面的是参数列表。- 对
Method
实例调用invoke
方法,就等同与直接使用该对象调用该方法。 - 调用静态方法的话第一个参数传入
null
即可,会被忽略。 - 同理,调用非
public
字段需要setAccessible(true)
。 - 当然也遵守多态原则。
我们通常用new
操作符创建新的实例,有了反射也可以通过Class
对象的方法来创建:
Student s = new Student();
Student s2 = Student.class.newInstance(); // 调用public无参构造
后者只能调用公有的无参构造,为了能够调用到所有构造,Java的反射API提供了Constructor
对象,包含一个构造方法的所以信息,可以用来创建一个实例,和Method
很类似,不同之处仅在于它是构造方法,并且总是返回实例。Class
中用于获取Constructor
的方法:
public Constructor<T> getConstructor(Class<?>... parameterTypes) throws NoSuchMethodException, SecurityException
public Constructor<?>[] getConstructors() throws SecurityException
public Constructor<T> getDeclaredConstructor(Class<?>... parameterTypes) throws NoSuchMethodException, SecurityException
public Constructor<?>[] getDeclaredConstructors() throws SecurityException
同理前两者获取public的构造,后两者获取所有访问权限的构造,不同于方法和字段的是前两个方法不会获取到基类的构造,因为并不能调用基类的构造方法来构造子类的对象。如果是非静态的Inner class,那么第一个参数还需要额外传入内部类关联的实例,不展开详述。
Constructor
类型:
- 定义:
public final class Constructor<T> extends Executable
- 方法:设置访问权限、获取定义的类、名称、修饰符、参数列表类型、异常类型、调用构造方法等。
public void setAccessible(boolean flag)
public Class<T> getDeclaringClass()
public String getName()
public int getModifiers()
public TypeVariable<Constructor<T>>[] getTypeParameters()
public Class<?>[] getExceptionTypes()
public T newInstance(Object ... initargs) throws
InstantiationException, IllegalAccessException,
IllegalArgumentException, InvocationTargetException
获取一个Class
对象的三种方法:
className.class
classInstance.getClass()
Class.forName(classNameString)
对同一个类而言,这三种方法获取的都是同一个实例,JVM对每个类只会创建一个Class
实例。
获取父类的Class
,前面已经有提到,就是Class
的getSuperClass
方法,获取接口则使用getInterfaces
接口:
public native Class<? super T> getSuperclass();
public Class<?>[] getInterfaces()
判断继承关系:
- 如果是一个实例,那么使用
instanceof
Double n = Double.valueOf(10.0); boolean isDouble = n instanceof Double;
- 如果是
Class
对象,那么使用isAssignableFrom
,含义是cls
表示的类的对象是否可以被赋给this
表示的类的变量,即是传入的Class
是否是当前Class
的子类。// declaration public native boolean isAssignableFrom(Class<?> cls); // calling boolean isNumber = Number.class.isAssignableFrom(Integer.class); // true
- 判断一个对象是否是一个类或者其子类的对象:
isInstance
,等价于使用instanceof
// declaration public native boolean isInstance(Object obj); // calling Integer n = Integer.valueOf(10); boolean isNumber = Number.class.isInstance(n); // true
Java的class
和interface
的区别就是接口可以多继承,接口没有构造,接口不能有类成员,接口不能实例化。当然抽象类也不可以实例化,这样看感觉其实也就多继承和区别而已,因为需要用接口来多继承所以才不能有构造和实例字段。
那么能不能不编写实现类,在运行时创建出一个inteface
实例呢?Java标准库提供了动态代理(Dynamic Proxy)来实现这个事情。
所谓的动态是和静态对应的,典型的静态创建即定义类来实现接口,然后实例化类对象并用接口来调用:
interface Hello {
public void morning();
}
class HelloWorld implements Hello {
public void morning() {
System.out.println("hello, world");
}
}
public class Test {
public static void Main() {
Hello h = new HelloWorld();
h.morning();
}
}
那么动态创建怎么做呢?
import java.lang.reflect.InvocationHandler;
import java.lang.reflect.Method;
import java.lang.reflect.Proxy;
interface Hello {
public void morning();
}
public class Main {
public static void main(String[] args) throws Exception {
InvocationHandler handler = new InvocationHandler() {
@Override
public Object invoke(Object proxy, Method method, Object[] args) throws Throwable {
System.out.println(method);
if (method.getName().equals("morning"))
{
System.out.println("hello,world");
}
return null;
}
};
Hello h = (Hello)Proxy.newProxyInstance(
Hello.class.getClassLoader(),
new Class[] {Hello.class},
handler);
h.morning();
}
}
方法如下:
- 定义一个
InvocationHandler
实例,负责实现接口的方法调用,这里的语法是使用匿名类实现了InvocationHandler
接口的invoke
方法,并且在其中动态实现了morning
方法。 - 通过
Proxy.newProxyInstance()
创建interface
实例,需要三个参数:- 使用的
ClassLoader
,通常就是接口的ClassLoader
,通过接口Class
实例的getClassLoader
方法获取。 - 需要实现的接口数组,至少传入一个接口。
- 处理调用方法的
InvocationHandler
实例。
- 使用的
- 将返回的
Object
实例转换为接口。
其实实现的方式就是JVM为我们自动编写了一个类(不需要源码直接生成字节码),并不存在可以直接实例化接口的黑魔法。而且因为最终创建的对象是通过接口来用,也就没有办法添加和使用实例字段。暂不清楚使用场景。
动态代理是通过Proxy
创建代理对象,然后将方法代理给InvocationHandler
完成的。
更多理解TODO。
注解(Annotation)是放在Java源码的类、字段、方法、参数前的一种特殊“注释”。注释会被编译器直接忽略,但注解可以被编译器打包进class
文件中,因此,注解是一种用作标注的“元数据”。比如重写基类方法时开头添加的@Override
就是注解。
注解的作用:
从JVM的角度看,注解本身对代码逻辑没有任何影响,如何使用注解完全由工具(比如一些库自己定义的注解)、你的代码(你自己定义的注解需要编写逻辑来使用它)决定。Java的注解可以分为三类:
第一类是由编译器使用的注解,如:
@Override
:让编译器检查方法是否正确实现了覆写。@SuppressWarnings
:告诉编译器忽略此处代码产生的警告。
类注解不会被编译到.class
文件中,编译后就被扔掉了。
第二类是由工具处理的.class
文件时使用的注解,比如某些工具加载class时候会对class做动态修改,实现一些特殊的功能。这类注解会被编译到.class
文件中,但加载结束后不会存在于内存中。这类注解只会被一些底层库使用,一般我们不必处理。例如?
第三类是程序运行期能够读取的注解,加载后一直存在JVM中,这也是最常用的注解。比如一个配置了@PostConstruct
注解的方法会在调用构造方法后自动被调用,这是我们自己的Java代码读取该注解需要实现的功能,JVM并不认识该注解也不会帮你实现你脑子里的东西。
定义一个注解时,还可以定义配置参数,配置参数可以包括:
- 所有基本类型
String
- 枚举
- 基本类型、
String
、Class
以及枚举的数组
因为配置参数必须是常量,上述的限制保证了注解在定义时就已经确定了每个参数的值,就是说编译期就已经确定了。
注解的配置参数可以有默认值,缺少某个配置参数时将使用默认值。大部分注解会有一个名为value
的配置参数,对此参数赋值,可以只写常量,相当于省略了value
参数。如果只写注解,相当于全部使用默认值。
public class Hello {
@Check(min=0, max=100, value=55) // 定义了三个参数
public int n;
@Check(value=99) // 只定义了一个value参数
public int p;
@Check(99) // 等价于@Check(value=99)
public int x;
@Check // 全部使用默认值
public int y;
}
注解当然不是从虚空中生长出来的,Java语言使用@interface
语法来定义注解。格式如下:
public @interface Report {
int type() default 0;
String level() default "info";
String value() default "";
}
@interface
定义注解名,注解的参数类似无参数方法,使用类型 参数名() default 默认值;
这样的语法来定义,可以用default
设定一个默认值(强烈推荐)。最常用的参数应当命名为value
(这样使用时就可以不写参数名)。
元注解:一些可以被用来修饰其他注解的注解(搁着套娃呢?),这些注解就被称为元注解(meta annotation)。元注解也是注解,当然也可以被元注解修饰。
Java标准库定义了一些元注解,通常不需要自己去编写元注解,就是说其实也是可以的喽。
@Target:最常用的元注解,使用@Target
用来定义注解可以被用于源码的哪些位置:
- 类或接口:
ElementType.TYPE
- 字段:
ElementType.FIELD
- 方法:
ElementType.METHOD
- 构造方法:
ElementType.CONSTRUCTOR
- 方法参数:
ElementType.PARAMETER
- 其他:
LOCAL_VARIABLE
ANNOTATION_TYPE
PACKAGE
TYPE_PARAMETER
TYPE_USE
MODULE
例如定义@Report
注解可以用于方法上,则需要加上元注解@Target(ElementType.METHOD)
。
@Target(ElementType.METHOD)
public @interface Report {
int type() default 0;
String level() default "info";
String value() default "";
}
ElementType
是一个位于java.lang.annotation
的枚举类型,和注解@Target
一样使用时都需要导入。@Target
的value
参数是一个ElementType[]
,如果可以用在多个位置,则需要使用数组@Target({ElementType.METHOD, ElementType.TYPE})
,只用在一个位置则可以只使用一个枚举值。
@Retention:定义注解的生命周期:
- 仅编译期:
RetentionPolicy.SOURCE
- 仅
class
文件:RetentionPolicy.CLASS
- 运行期:
RetentionPolicy.RUNTIME
如果@Retention
不存在,则该注解默认为CLASS
,通常我们自定义的注解都是RUNTIME
,所以务必要加上@Retention(RetentionPolicy.RUNTIME)
这个元注解。
@Repeatable:使用这个元注解可以定义注解是否可以重复,应用不是很广泛。经过@Repeatable
修饰之后,就可以在某个类型声明处添加多个注解。
@Repeatable(Reports.class)
@Target(ElementType.TYPE)
@interface Report {
int type() default 0;
String level() default "info";
String value() default "";
}
@Target(ElementType.TYPE)
@interface Reports {
Report[] value();
}
@Report(type=1, level="debug")
@Report(type=2, level="warning")
class Hello {
}
@Inherited:定义子类是否可以继承父类的注解,@Inherited
仅针对@Target(ElementType.TYPE)
的注解有效,并且仅针对class
继承,对interface
继承无效。
以上这些元注解都是定义在包java.lang.annotation
中的,前面说到的标准库中的注解如@Override
/@SuppressWarnings
是定义在java.lang
中自动导入的,并不是编译器或者JVM凭空生成的。
总结:
- 注解使用
@interface
定义。 - 可定义多个参数和默认值,核心参数使用
value
名称。 - 必须使用
@Target
来指定注解可以应用的范围。 - 自定义注解时应当设置
@Retention(RetentionPolicy.RUNTIME)
以便运行期读取改注解。
到这里其实我已经有一堆疑问了:
- 为什么用
@interface
来定义,感觉这么暧昧,注解可以理解为一种特殊的类型/接口定义吗? - 注解到底是怎么起作用的?我自己定义的注解能够做到些什么?应该怎么编写逻辑来实现注解的功能?标准库的如
@Override
这种注解是怎么实现效果的?是写在代码中的逻辑?还是java编译器的特殊处理? - java编译器如何处理
RetentionPolicy.SOURCE
的注解?.class
文件如何保存RetentionPolicy.CLASS
的注解?JVM如何看待和处理RetentionPolicy.RUNTIME
的注解?
根据@Retention
的配置:
RetentionPolicy.SOURCE
类型的注解主要由编译器使用,因此我们一般只使用,不编写。RetentionPolicy.CLASS
的注解主要由底层工具使用,涉及到class的加载,一般我们很少用到。RetentionPolicy.RUNTIME
的注解会被经常用到,经常需要编写。
这里只讨论如何读取RetentionPolicy.RUNTIME
类型的注解。注解定义后也是一种class
,所有注解都继承自java.lang.annotation.Annotation
。读取注解需要使用反射API。
java提供的使用反射API读取注解的方法包括:
判断某个注解是否存在于Class
Field
Method
Constructor
:
Class.isAnnotationPresent(Class)
Field.isAnnotationPresent(Class)
Method.isAnnotationPresent(Class)
Constructor.isAnnotationPresent(Class)
Clss
是实现了这个方法的,后三者是直接或间接从基类AccessibleObject
继承而来的该方法。最终都是实现的最顶层接口AnnotatedElement
的方法。
AnnotatedElement
接口定义,主要是判断注解是否存在和获取注解:
default boolean isAnnotationPresent(Class<? extends Annotation> annotationClass)
<T extends Annotation> T getAnnotation(Class<T> annotationClass);
Annotation[] getAnnotations();
default <T extends Annotation> T[] getAnnotationsByType(Class<T> annotationClass)
default <T extends Annotation> T getDeclaredAnnotation(Class<T> annotationClass)
default <T extends Annotation> T[] getDeclaredAnnotationsByType(Class<T> annotationClass)
Annotation[] getDeclaredAnnotations();
这里的Annotation
接口的就是所有注解的基类。定义:
public interface Annotation {
boolean equals(Object obj);
int hashCode();
String toString();
Class<? extends Annotation> annotationType();
}
使用反射API读取注解:
- 对于
Class
Field
Method
Constructor
的话就是使用AnnotatedElement.getAnnotation()
等相关接口了。Class
Field
Method
Constructor
都是有定义的。如果不存在对应的注解,会返回null
。可以通过返回值是否为null
来判断是否有传入的注解。 - 而要获取到方法参数的注解就相对麻烦了,因为可能有多个参数,每个参数也可能有多个注解,所以结果使用一个二维数组来表示。使用
public abstract Annotation[][] getParameterAnnotations();
方法,最顶层定义在Executable
中(Method
和Constructor
的抽象基类),在Field
和Constructor
中做了实现。
使用注解:我们要在运行期来使用注解,那必然是使用RetentionPolicy.RUNTIME
类型的注解,那注解要怎么用呢?这完全由程序自己决定,也就是说我们必须编写代码来使用注解,使用方法就是通过反射去读取。JVM并不会对我们的注解添加任何额外的逻辑,应该说通过反射的统一处理仅仅是将其作为了一个类动态加载进来然后将一个编译期就已经确定内容的注解实例关联到对应的类、方法、字段、参数等上而已。
我的理解:不使用注解是完全OK的,但注解提供了一种方法让我们能够定义自己的关于类、构造、方法、实例等的“规则”,以提供给自己活着其他人使用。这个规则的解释完全由自己的程序进行实现。
例子,定义一个@Range
注解,希望用它来定义一个String
字段的规则:字段长度必须满足@Range
参数的定义:
- 定义注解
@Retention(RetentionPolicy.RUNTIME)
@Target(ElementType.FIELD)
public @interface Range {
int min() default 0;
int max() default 255;
}
- 使用注解
public class Person {
@Range(min=1, max=20)
public String name;
@Range(max=10)
public String city;
}
- 编写注解的规则
void check(Person person) throws IllegalArgumentException, ReflectiveOperationException {
// 遍历所有Field:
for (Field field : person.getClass().getFields()) {
// 获取Field定义的@Range:
Range range = field.getAnnotation(Range.class);
// 如果@Range存在:
if (range != null) {
// 获取Field的值:
Object value = field.get(person);
// 如果值是String:
if (value instanceof String) {
String s = (String) value;
// 判断值是否满足@Range的min/max:
if (s.length() < range.min() || s.length() > range.max()) {
throw new IllegalArgumentException("Invalid field: " + field.getName());
}
}
}
}
}
这样通过@Range
配合check()
方法,就可以完成Person
实例的检查。虽然就这个例子而言谁都能够想到替代的写法,但好像的确能够更方便一些的样子,比如说如果新增加了一个字段并且同样需要进行长度校验的话那么只需要在新字段上添加注解而不需要去修改check
的逻辑。更多使用场景待挖掘,任何东西都需要结合具体的使用场景才能够有深刻的理解。
梳理反射和注解相关的类、接口、方法,了解实现,了解java.lang.relfect
包。
可以将类型作为参数,从而创建一种可以同时用于多种类型的通用的逻辑的方法。比如创建一种可以应用于所有类型的变长数组类型:ArrayList<T>
,其中T
是数据元素的类型。T
需要编译期可知,当然一个类型不可能编译期不知道,这里的T
是指的int
double
Runnable
这种内置类型或已经在代码中定义的类型,而不是反射中和一个类型相关联的Class
对象。
向上转型,标准库的ArrayList<T>
实现了List<T>
接口,所以可以向上转型。但是需要注意这里的T
是整个类型定义的一部分,ArrayList<Integer>
不能转换为ArrayList<Number>
或者List<Number>
。T
必须严格一致才能向上转换。类型参数T
不一致的,比如ArrayList<Integer>
和List<Number>
是没有继承关系的两个类型。
和C++模板差不太多,就是编写模板代码来适应任意类型,类型参数确定之后才成为一个类型,参数类型不同的模板类是不同的类型。
那么C++的模板特化偏特化、模板递归、可变模板参数、模板元编程这种烧脑袋的东西有没有对应的呢?
TODO:深入了解Java泛型的实现方式,和C++模板有何异同。
以java.util.ArrayList
为例,如果不定义泛型类型,泛型类型��际上就是Object
,相当于默认类型参数是Object
,这个机制应该是语言层面实现的,因为java并没有默认参数或者默认类型参数这种东西。
List list = new ArrayList();
list.add("hello");
System.out.println((String)list.get(0));
当定义泛型类型为String
之后,List<T>
泛型接口变为强类型List<String>
。
List list = new ArrayList<String>();
list.add("hello");
System.out.println(list.get(0));
编译器如果能自动推断出泛型类型,就可以省略后面的泛型类型。如用ArrayList<T>
指定泛型类型为String
后,接口List<T>
就自动成为List<String>
。
除了类,接口也可以使用泛型,正如List<T>
。一如:
public interface Comparable<T> {
public int compareTo(T o);
}
对于Arrays.sort
接口对数组元素排序就会使用Comparable.compareTo
来比较,元素类型需要实现Comparable
接口后才能调用。如果未实现则会抛出java.lang.ClassCastException
提示元素类型不能转化为java.lang.Comparable
。但这样其实只能对元素按照一种类型来排序,如果需要更高的可定制性,可以使用Arrays
的public static <T> void sort(T[] a, Comparator<? super T> c)
接口传入一个Comparator
已进行更加灵活的比较。当然也可以在重写compareTo
比较多种比较方式,加上标记或者boolean
实例成员来控制即可。
编写泛型类比普通类复杂,泛型类一般用于集合类中。
比如编写一个类表示键值对:先用一个特定类型来实现。
class kvPair {
private String key;
private String value;
public String getKey() {
return key;
}
public void setKey(String key) {
this.key = key;
}
public String getValue() {
return value;
}
public void setValue(String value) {
this.value = value;
}
}
然后将String
替换为T
,并在类名后面加上类型参数<T>
的声明。
class kvPair<T> {
private T key;
private T value;
public T getKey() {
return key;
}
public void setKey(T key) {
this.key = key;
}
public T getValue() {
return value;
}
public void setValue(T value) {
this.value = value;
}
}
那么如果我需要键和值可以是不同的类型呢,添加多个泛型类型参数即可。
class kvPair<K, V> {
private K key;
private V value;
public K getKey() {
return key;
}
public void setKey(K key) {
this.key = key;
}
public V getValue() {
return value;
}
public void setValue(V value) {
this.value = value;
}
}
实例方法是类的一部分,泛型参数类型对其是可见的。但是对于静态方法来说,类的泛型类型参数对其是不可见的,如果要定义静态泛型方法,需要为静态泛型方法专门指定静态类型参数。这里的静态方法的K
V
和kvPair<K, V>
中的K
V
是没有任何关系的,完全可以替换为其他名称。如果不在static
后指定静态类型参数的话会报错:不能对非静态类型K
/V
进行静态引用。
class kvPair<K, V> {
private K key;
private V value;
public kvPair(K k, V v) {
key = k;
value = v;
}
public K getKey() {
return key;
}
public void setKey(K key) {
this.key = key;
}
public V getValue() {
return value;
}
public void setValue(V value) {
this.value = value;
}
public static<K, V> kvPair<K, V> create(K key, V value) {
return new kvPair<K, V>(key, value);
}
}
使用时:如果就是实例化这个类的对象,那么类型声明时需要写上类型参数,不然类型还是会默认为Object
,而且貌似类型参数不能使用内置类型,因为默认是Object
无法持有内置类型的缘故吗?那么就使用相应的包装类型吧,应该就是提供了来满足类似这种场景的。
kvPair<String, Double> pair = new kvPair<String, Double>("xiaoming", 100.0);
不同于C++的模板实现,Java中的泛型实现方法是擦拭法(Type Erasure)。
所谓擦拭法是指:
- JVM对泛型一无所知,所有工作都是编译器做的。编写了一个泛型类
kvPair<K, V>
,虚拟机执行的代码就是kvPair<Object, Object>
。 - 然后编译器根据使用的具体的泛型类型参数实现了安全的强制类型转换。因为泛型类型参数都是编译期确定的,不能转换就会报错停止编译。
所以,Java的泛型是编译器在编译器实现的,编译器内部永远把所有类型T
当做Object
处理(即是说擦拭成了Object
),但是需要转换类型时,编译器会自动根据T
的类型为我们安全的实行强制转换。
所以必然就有局限:
<T>
不能是基本类型,因为Object
无法持有基本类型。- 无法取得类型参数的
class
,因为class
是运行期的。编译期对编译器来说所有泛型类型参数都是Object
。 - 无法区分带泛型的类型,因为都是同一个
Class
对象。 - 不能实例化类型参数
T
的变量,实例化Object
明显不是我们想要的,所以java编译器阻止了在泛型类中对参数类型变量的实例化。
所以kvPair<Object, Object>
和kvPair
和kvPair<String, Double>
实际上是一个类型,他们的Class
对象是同一个。那直观感受来看和C++的模板是有区别的,C++的模板会为每一种模板类型参数生成一个类或者函数的机器码,模板参数实际上最终的类的一部分,所以以上局限都是没有的。而Java中的泛型看来类型参数只是提供了用来告诉编译器需要如何做类型转换的手段,而并不是类型的一部分。
不恰当的覆写:
public class Pair<T> {
public boolean equals(T t) {
return this == t;
}
}
像这样的代码其实会被擦拭成equals(Object t)
,这个方法是继承自Object
的,编译器会阻止一个实际上会变成覆写的方法定义。错误提示为:类型 Pair<T>
的方法 equals(T)
与类型 Object
的 equals(Object)
具有相同的擦除,但是未覆盖它。
需要换个方法名,避免与Object.equals(Object)
冲突。
public class Pair<T> {
public boolean same(T t) {
return this == t;
}
}
泛型类的继承:
一个类可以继承自一个泛型类。比如
class StringDoublePair extends kvPair<String, Double> {
public StringDoublePair() {
super("", 0.0);
}
}
继承之后StringDoublePair
的基类的类型参数是确定的,就是<String, Double>
,但是我们无法通过kvPair.class
对象获取到这个类型参数。但在继承了泛型类型的情况下,子类是可以获取到父类的泛型类型的。获取方式:
import java.lang.reflect.ParameterizedType;
import java.lang.reflect.Type;
public class Main {
public static void main(String[] args){
Class<StringDoublePair> cls = StringDoublePair.class;
Type t = cls.getGenericSuperclass();
if (t instanceof ParameterizedType) {
ParameterizedType pt = (ParameterizedType)t;
Type[] types = pt.getActualTypeArguments();
for (Type typeArgs : types) {
Class<?> typeClass = (Class<?>)typeArgs;
if (typeClass != null) {
System.out.println(typeClass);
}
}
}
}
}
这里获取到的是Type
,因为java引入了泛型,所以单纯的Class
用来标识类型就不够了,Java的类型系统结构如下:
Type
|____Class
|____ParameterizedType
|____GenericArrayType
|____WildcardType
还是上面的kvPair
,如果定义一个适用于kvPair<Number, Number>
的方法:
class PairHelper {
public static int add(kvPair<Number, Number> pair) {
return pair.getKey().intValue() + pair.getValue().intValue();
}
}
那么下面的语句时能够编译通过的:
int sum = PairHelper.add(new kvPair<Number, Number>(1, 1));
但是其实参数的类型是(Integer, Integer)
,如果类型参数就是Integer
呢:
int sum = PairHelper.add(new kvPair<Number, Number>(1, 1));
编译错误:类型 PairHelper
中的方法add(kvPair<Number,Number>)
对于参数(kvPair<Integer,Integer>)
不适用。
原因很简单:类型kvPair<Integer,Integer>
不是kvPair<Number,Number>
的子类。但是很明显kvPair<Integer,Integer>
参数类型运用于add
函数是完全满足内部代码的类型规范的,即基类或者接口来使用子类对象。
那现在有没有方法能够使得方法add
能够接受kvPair<Type2, Type2>
其中Type1
Type2
是Number
子类呢?办法当然是有的,就是定义add
时使用? extends Number
替代类型参数Number
。
class PairHelper {
public static int add(kvPair<? extends Number, ? extends Number> pair) {
return pair.getKey().intValue() + pair.getValue().intValue();
}
}
这种使用<? extends Number>
的泛型定义称为上界通配符(Upper Bounds Wildcards)。即把泛型类型参数T
的上界限定为Number
,就是只要是Number
和其子类都可以。
此时编译器能够确定kvPair<? extends Number, ? extends Number>
的getKey
getValue
接口返回值一定Number
或其子类,但无法确定具体类型。
使用了通配符之后能不能用子类实例设置给基类成员呢?
class PairHelper {
public static int add(kvPair<? extends Number, ? extends Number> pair) {
pair.setKey(Integer.valueOf(pair.getKey().intValue() + 100));
pair.setKey(Integer.valueOf(pair.getValue().intValue() + 100));
return pair.getKey().intValue() + pair.getValue().intValue();
}
}
这时会编译错误提示:类型 kvPair<capture#1-of ? extends Number,capture#2-of ? extends Number>
中的方法 setKey(capture#1-of ? extends Number)
对于参数(Integer)
不适用
编译错误的原因还是在于擦拭法,这就是<? extends Number>
通配符的一个重要限制:
- 方法参数签名
setKey(? extends Number)
无法传递任何Number
或者子类型给setKey(? extends Number)
,唯一的例外是可以传入null
。 - 对于方法类型参数
<? extends Number>
的泛型参数来说,方法内部不能调用它的传入Number
引用的方法,总结来说只读不能写。为什么呢?这里我有一万个问号?后续再来理解,TODO。
定义泛型类时也可以用<T extends Number>
这样的方式使用通配符来限定T
的类型。那么实例化时该类型参数就只能使用Number
或者其子类。这里当然也可以是interface
,只不过语法规定为使用extends
。
除了extends
通配符外还有super
通配符,对于类型参数中有<? super Integer>
的实例来说。
- 对应地,可以使用
Integer
和它的基类来进行匹配。 - 使用该类型作为方法参数时,该参数只能写不能读,不能调用它的返回
<? super Integer>
类型的接口,但可以调用它的使用<? super Integer>
参数的接口。就上面例子来说就是能调setKey
不能调用getKey
。
PECS原则:一般使用extends
和super
是遵循Producer Extends Consumer Super。即生产者使用extends
,而消费者使用super
。
除了extends
和super
通配符,Java
的泛型还允许使用无限定通配符(Unbounded Wildcard Type),即只定义一个?
。
特点:
- 因为
<?>
通配符既没有extends
也没有super
:- 不允许调用
set(T)
方法并传入引用(null
除外)。 - 不允许调用
T get()
方法并获取T
引用(只能获取Object
引用)。 - 即既不能读也不能写,只能做一些
null
判断。
- 不允许调用
- 大多数情况可以引入泛型参数
<T>
消除<?>
的使用,就是说可以替换。 - 无限定通配符
<?>
很少使用。
<?>
通配符有一个独特的特点,就是pair<?>
是所有pair<T>
的超类,可以安全地向上类型转换。
到这里我只能说并没有搞懂为什么要有extends
和super
通配符这两个东西,也没有完全理解,TODO。
java的部分反射API也是泛型,比如Class
类就是泛型:
public final class Class<T> implements java.io.Serializable,
GenericDeclaration,
Type,
AnnotatedElement,
TypeDescriptor.OfField<Class<?>>,
Constable {
public static Class<?> forName(String className) {...}
public native boolean isAssignableFrom(Class<?> cls);
public TypeVariable<Class<T>>[] getTypeParameters() {...}
public native Class<? super T> getSuperclass();
public Class<?>[] getInterfaces() {...}
public Type[] getGenericInterfaces() {...}
public Class<?> getComponentType() {...} // 获取元素类型,仅对数组类型有效,否则返回null
public Class<?> getDeclaringClass() throws SecurityException {...}
public Constructor<?>[] getConstructors() throws SecurityException {...}
// other method about Constructor ...
public <A extends Annotation> A getAnnotation(Class<A> annotationClass) {...}
public boolean isAnnotationPresent(Class<? extends Annotation> annotationClass) {...}
// etc ...
}
构造方法Constructor<T>
也是泛型。
泛型与数组:
- 我们可以声明带泛型的数组,但不能直接
new
带泛型的数组,需要经过强制类型转换。
Pair<String>[] ps = null; // ok
Pair<String>[] ps = new Pair<String>[2]; // compile error!
@SuppressWarnings("unchecked")
Pair<String>[] ps = (Pair<String>[]) new Pair[2]; // ok
- 要安全使用泛型数组,不要将上述
new Pair[2]
的结果保存之后使用。因为new Pair[2]
的结果不是泛型数组,编译器不会检查。 - 带泛型的数组编译器也会做类型擦除:
Pair<String>[] ps = (Pair<String>[]) new Pair[2];
System.out.println(ps.getClass() == Pair[].class); // true
- 不能直接创建泛型数组
T[]
,因为擦拭后代码变为Object[]
// compile error:
public class Abc<T> {
T[] createArray() {
return new T[5];
}
}
- 必须借助
java.lang.reflect.Array
来创建
T[] createArray(Class<T> cls) {
return (T[]) Array.newInstance(cls, 5);
}
- 还可以利用可变参数创建泛型数组:
public class ArrayHelper {
@SafeVarargs
static <T> T[] asArray(T... objs) {
return objs;
}
}
- 谨慎使用泛型可变参数,如果仔细观察,可以发现编译器对所有可变泛型参数都会发出警告,除非确认完全没有问题,才可以用
@SafeVarargs
消除警告。跟详细解释参考Effective Java,看起来java的“上层建筑”确实有点太多太繁杂了。
说实话泛型有点云里雾里的感觉,后续看书补充理解,TODO。
集合大部分时候应该会是使用最多的类型,因为任何东西都需要存储、管理,元素多了的时候就需要使用集合来存储。其中各式各样的数据结构服务于各种不同的使用场景:存储、查找、遍历、增删修改元素等操作的不同侧重。
数组的限制:
- 数组初始化后大小不可变。
- 数组只能按索引顺序存取,即随机存取。
其他存储需求:
- 可变大小
- 保证无重复元素
- 快速查找
java.util.Collection:java标准库提供的集合类,定义在java.util
包中,除Map
所有其他集合类的根接口。java.util
包主要提供了三种类型集合:
List
一种有序列表的集合。Set
一种保证没有重复元素的集合。Map
一种通过键值(key-value)查找的映射表集合。
Java集合设计特点:
- 接口和实现类分离,有序表接口
List
,实现ArrayList
LinkedList
。 - 支持泛型。
- 同一方式访问:迭代器(Iterator)。好处:无需知道集合内部元素的存储方式。
Java集合历史久远,不应再使用的遗留类:
Hashtable
一种线程安全的Map
实现Vector
一种线程安全的List
实现Stack
基于Vector
实现的LIFO的栈
不应使用的遗留接口:
Enumeration<E>
:已被Iterator<E>
取代。
Collection
接口:
public interface Collection<E> extends Iterable<E> {
int size();
boolean isEmpty();
boolean contains(Object o);
Iterator<E> iterator();
Object[] toArray();
<T> T[] toArray(T[] a);
default <T> T[] toArray(IntFunction<T[]> generator) {
return toArray(generator.apply(0));
}
boolean add(E e);
boolean remove(Object o);
boolean containsAll(Collection<?> c);
boolean addAll(Collection<? extends E> c);
boolean removeAll(Collection<?> c);
default boolean removeIf(Predicate<? super E> filter) { // 移除所有满足给定条件的元素
Objects.requireNonNull(filter);
boolean removed = false;
final Iterator<E> each = iterator();
while (each.hasNext()) {
if (filter.test(each.next())) {
each.remove();
removed = true;
}
}
return removed;
}
boolean retainAll(Collection<?> c);
void clear();
boolean equals(Object o);
int hashCode();
@Override
default Spliterator<E> spliterator() {
return Spliterators.spliterator(this, 0);
}
default Stream<E> stream() {
return StreamSupport.stream(spliterator(), false);
}
default Stream<E> parallelStream() {
return StreamSupport.stream(spliterator(), true);
}
}
Iterable
接口:
public interface Iterable<T> {
Iterator<T> iterator(); // 迭代器
default void forEach(Consumer<? super T> action) { // 对所有元素执行传入的操作
Objects.requireNonNull(action);
for (T t : this) {
action.accept(t);
}
}
default Spliterator<T> spliterator() {
return Spliterators.spliteratorUnknownSize(iterator(), 0);
}
}
有序列表,可变数组实现ArrayList
,和链表实现LinkedList
,对比:
ArrayList | LinkedList | |
---|---|---|
获取 | 快 | 从头查找,慢 |
添加到末尾 | 快 | 快 |
指定位置添加/删除 | 需要移动元素 | 不需要移动元素 |
内存占用 | 小 | 较大 |
通常情况下,我们总是优先使用ArrayList
。
List
接口:
public interface List<E> extends Collection<E> {
// Query Operations
int size();
boolean isEmpty();
boolean contains(Object o);
Iterator<E> iterator(); // 迭代器
Object[] toArray(); // 返回列表元素构成的一个重新分配的数组
<T> T[] toArray(T[] a); // 返回特定类型,如果可以的话返回内置数组(如ArrayList),否则新分配
// Modification Operations
boolean add(E e); // 添加元素到末尾
boolean remove(Object o); // 移除特定元素
// Bulk Modification Operations
boolean containsAll(Collection<?> c); // 包含集合中所有元素
boolean addAll(Collection<? extends E> c); // 添加集合所有元素到列表末尾,参数是自己的话未定义行为
boolean addAll(int index, Collection<? extends E> c); // 添加集合元素到index开始位置,从index开始所有元素向后移
boolean removeAll(Collection<?> c); // 移除当前列表中所有在集合中的元素
boolean retainAll(Collection<?> c); // 移除所有不在集合中的元素,保留集合中的元素
default void replaceAll(UnaryOperator<E> operator) {...} // 替换所有元素对给该元素应用传入的operator之后的结果
@SuppressWarnings({"unchecked", "rawtypes"})
default void sort(Comparator<? super E> c) {...} // 使用传入的比较运算对数组元素进行s稳定排序(不会重排相等的元素)
void clear(); // 清空所有元素
// Comparison and hashing
boolean equals(Object o); // 和另一个List判等,同一位置元素相同、相同大小则等
int hashCode(); // 哈希值,根据列表所有元素哈希值求得
// Positional Access Operations
E get(int index); // 获取元素
E set(int index, E element); // 设置元素
void add(int index, E element); // 添加/插入元素到下标index处,index开始所有元素右移
E remove(int index); // 移除index处元素,后面元素左移
// Search Operations
int indexOf(Object o); // 第一个出现元素下标,没有则返回-1
int lastIndexOf(Object o); // 最后一个出现的该元素下标,没有则返回-1
// List Iterators
ListIterator<E> listIterator(); // 列表迭代器
ListIterator<E> listIterator(int index); // 从index开始的列表迭代器
// View
List<E> subList(int fromIndex, int toIndex); // 返回一个子列表,包括fromIndex,不包括toIndex,相等则返回空
@Override
default Spliterator<E> spliterator() {...}
@SuppressWarnings("unchecked")
static <E> List<E> of() {...} // 得到空列表
// other of method ... // 得到由传入的多个元素构成的列表,不接受null值
static <E> List<E> copyOf(Collection<? extends E> coll) {...} // 得到传入集合元素构成的不可修改的列表
}
特点:
- 允许添加重复元素。
- 允许添加
null
元素。 - 不支持
[]
取元素,仅有原生数组支持[]
。不能运算符重载有点微妙。
遍历:String
列表为例
- 经典
for
循环,对ArrayList
来说是随机存取,但链表访问需要遍历,但要遍历修改还是得老老实实用。
for (int i = 0; i < list.size(); i ++) {
String elem = list.get(i);
// ...
}
- 范围
for
循环,通过迭代器实现,但不能修改元素
for (String elem : list) {
// ...
}
- 迭代器遍历,始终推荐使用迭代器
Iterator<String> iter = list.iterator();
while (iter.hasNext()) {
String elem = iter.next();
// ...
}
常用方法解析:
toArray()
只能返回Object[]
少用。toArray(T[])
更为常用,填充传入的数组并返回,如果传入的数组元素不够,那么会重新分配并返回,如果超过了,剩余的会填null
。一般都根据列表大小传:Integer[] array = list.toArray(new Integer[list.size()]);
。- 所有会比较两个元素的操作都是调用
equals
方法判等。要正确使用查找相关的方法,就必须正确重写equals
方法。
如何正确覆写equals
方法:
- 自反性(Reflexive):非
null
的x
来说,x.equals(x)
一定返回true
- 对称性(Symmetric):非
null
的x
和y
,x.equals(y)
结果一定和y.equals(x)
相同 - 传递性(Transitive):非
null
的x
、y
、z
,如果x.equals(y)==true
,y.euqals(z) == true
,那么y.equals(z)
一定为true
- 一致性(Consistent):非
null
的x
和y
,只要x
和y
状态不变,则x.euqals(y)
总是一致地返回true
或者false
,就是它不能薛定谔,需要具有确定性。 - 对
null
的比较:x.equals(null)
一定返回false
Map
即键值(key-value)映射表,高效通过key
查找value
。
Map
接口:
public interface Map<K, V> {
// Query Operations
int size();
boolean isEmpty();
boolean containsKey(Object key);
boolean containsValue(Object value);
V get(Object key);
// Modification Operations
V put(K key, V value);
V remove(Object key);
// Bulk Operations
void putAll(Map<? extends K, ? extends V> m);
void clear();
// Views
Set<K> keySet();
Collection<V> values();
Set<Map.Entry<K, V>> entrySet();
interface Entry<K, V> {
K getKey();
V getValue();
V setValue(V value);
boolean equals(Object o);
int hashCode();
public static <K extends Comparable<? super K>, V> Comparator<Map.Entry<K, V>> comparingByKey() {
return (Comparator<Map.Entry<K, V>> & Serializable)
(c1, c2) -> c1.getKey().compareTo(c2.getKey());
}
public static <K, V extends Comparable<? super V>> Comparator<Map.Entry<K, V>> comparingByValue() {
return (Comparator<Map.Entry<K, V>> & Serializable)
(c1, c2) -> c1.getValue().compareTo(c2.getValue());
}
public static <K, V> Comparator<Map.Entry<K, V>> comparingByKey(Comparator<? super K> cmp) {
Objects.requireNonNull(cmp);
return (Comparator<Map.Entry<K, V>> & Serializable)
(c1, c2) -> cmp.compare(c1.getKey(), c2.getKey());
}
public static <K, V> Comparator<Map.Entry<K, V>> comparingByValue(Comparator<? super V> cmp) {
Objects.requireNonNull(cmp);
return (Comparator<Map.Entry<K, V>> & Serializable)
(c1, c2) -> cmp.compare(c1.getValue(), c2.getValue());
}
}
// Comparison and hashing
boolean equals(Object o);
int hashCode();
// Defaultable methods
default V getOrDefault(Object key, V defaultValue) {
V v;
return (((v = get(key)) != null) || containsKey(key))
? v
: defaultValue;
}
default void forEach(BiConsumer<? super K, ? super V> action) {
Objects.requireNonNull(action);
for (Map.Entry<K, V> entry : entrySet()) {
K k;
V v;
try {
k = entry.getKey();
v = entry.getValue();
} catch (IllegalStateException ise) {
// this usually means the entry is no longer in the map.
throw new ConcurrentModificationException(ise);
}
action.accept(k, v);
}
}
default void replaceAll(BiFunction<? super K, ? super V, ? extends V> function) {
Objects.requireNonNull(function);
for (Map.Entry<K, V> entry : entrySet()) {
K k;
V v;
try {
k = entry.getKey();
v = entry.getValue();
} catch (IllegalStateException ise) {
// this usually means the entry is no longer in the map.
throw new ConcurrentModificationException(ise);
}
// ise thrown from function is not a cme.
v = function.apply(k, v);
try {
entry.setValue(v);
} catch (IllegalStateException ise) {
// this usually means the entry is no longer in the map.
throw new ConcurrentModificationException(ise);
}
}
}
default V putIfAbsent(K key, V value) {
V v = get(key);
if (v == null) {
v = put(key, value);
}
return v;
}
default boolean remove(Object key, Object value) {
Object curValue = get(key);
if (!Objects.equals(curValue, value) ||
(curValue == null && !containsKey(key))) {
return false;
}
remove(key);
return true;
}
default boolean replace(K key, V oldValue, V newValue) {
Object curValue = get(key);
if (!Objects.equals(curValue, oldValue) ||
(curValue == null && !containsKey(key))) {
return false;
}
put(key, newValue);
return true;
}
default V replace(K key, V value) {
V curValue;
if (((curValue = get(key)) != null) || containsKey(key)) {
curValue = put(key, value);
}
return curValue;
}
default V computeIfAbsent(K key,
Function<? super K, ? extends V> mappingFunction) {
Objects.requireNonNull(mappingFunction);
V v;
if ((v = get(key)) == null) {
V newValue;
if ((newValue = mappingFunction.apply(key)) != null) {
put(key, newValue);
return newValue;
}
}
return v;
}
default V computeIfPresent(K key,
BiFunction<? super K, ? super V, ? extends V> remappingFunction) {
Objects.requireNonNull(remappingFunction);
V oldValue;
if ((oldValue = get(key)) != null) {
V newValue = remappingFunction.apply(key, oldValue);
if (newValue != null) {
put(key, newValue);
return newValue;
} else {
remove(key);
return null;
}
} else {
return null;
}
}
default V compute(K key,
BiFunction<? super K, ? super V, ? extends V> remappingFunction) {
Objects.requireNonNull(remappingFunction);
V oldValue = get(key);
V newValue = remappingFunction.apply(key, oldValue);
if (newValue == null) {
// delete mapping
if (oldValue != null || containsKey(key)) {
// something to remove
remove(key);
return null;
} else {
// nothing to do. Leave things as they were.
return null;
}
} else {
// add or replace old mapping
put(key, newValue);
return newValue;
}
}
default V merge(K key, V value,
BiFunction<? super V, ? super V, ? extends V> remappingFunction) {
Objects.requireNonNull(remappingFunction);
Objects.requireNonNull(value);
V oldValue = get(key);
V newValue = (oldValue == null) ? value :
remappingFunction.apply(oldValue, value);
if (newValue == null) {
remove(key);
} else {
put(key, newValue);
}
return newValue;
}
@SuppressWarnings("unchecked")
static <K, V> Map<K, V> of() {
return (Map<K,V>) ImmutableCollections.EMPTY_MAP;
}
static <K, V> Map<K, V> of(K k1, V v1) {
return new ImmutableCollections.Map1<>(k1, v1);
}
static <K, V> Map<K, V> of(K k1, V v1, K k2, V v2) {
return new ImmutableCollections.MapN<>(k1, v1, k2, v2);
}
static <K, V> Map<K, V> of(K k1, V v1, K k2, V v2, K k3, V v3) {
return new ImmutableCollections.MapN<>(k1, v1, k2, v2, k3, v3);
}
static <K, V> Map<K, V> of(K k1, V v1, K k2, V v2, K k3, V v3, K k4, V v4) {
return new ImmutableCollections.MapN<>(k1, v1, k2, v2, k3, v3, k4, v4);
}
static <K, V> Map<K, V> of(K k1, V v1, K k2, V v2, K k3, V v3, K k4, V v4, K k5, V v5) {
return new ImmutableCollections.MapN<>(k1, v1, k2, v2, k3, v3, k4, v4, k5, v5);
}
static <K, V> Map<K, V> of(K k1, V v1, K k2, V v2, K k3, V v3, K k4, V v4, K k5, V v5,
K k6, V v6) {
return new ImmutableCollections.MapN<>(k1, v1, k2, v2, k3, v3, k4, v4, k5, v5,
k6, v6);
}
static <K, V> Map<K, V> of(K k1, V v1, K k2, V v2, K k3, V v3, K k4, V v4, K k5, V v5,
K k6, V v6, K k7, V v7) {
return new ImmutableCollections.MapN<>(k1, v1, k2, v2, k3, v3, k4, v4, k5, v5,
k6, v6, k7, v7);
}
static <K, V> Map<K, V> of(K k1, V v1, K k2, V v2, K k3, V v3, K k4, V v4, K k5, V v5,
K k6, V v6, K k7, V v7, K k8, V v8) {
return new ImmutableCollections.MapN<>(k1, v1, k2, v2, k3, v3, k4, v4, k5, v5,
k6, v6, k7, v7, k8, v8);
}
static <K, V> Map<K, V> of(K k1, V v1, K k2, V v2, K k3, V v3, K k4, V v4, K k5, V v5,
K k6, V v6, K k7, V v7, K k8, V v8, K k9, V v9) {
return new ImmutableCollections.MapN<>(k1, v1, k2, v2, k3, v3, k4, v4, k5, v5,
k6, v6, k7, v7, k8, v8, k9, v9);
}
static <K, V> Map<K, V> of(K k1, V v1, K k2, V v2, K k3, V v3, K k4, V v4, K k5, V v5,
K k6, V v6, K k7, V v7, K k8, V v8, K k9, V v9, K k10, V v10) {
return new ImmutableCollections.MapN<>(k1, v1, k2, v2, k3, v3, k4, v4, k5, v5,
k6, v6, k7, v7, k8, v8, k9, v9, k10, v10);
}
@SafeVarargs
@SuppressWarnings("varargs")
static <K, V> Map<K, V> ofEntries(Entry<? extends K, ? extends V>... entries) {
if (entries.length == 0) { // implicit null check of entries array
@SuppressWarnings("unchecked")
var map = (Map<K,V>) ImmutableCollections.EMPTY_MAP;
return map;
} else if (entries.length == 1) {
// implicit null check of the array slot
return new ImmutableCollections.Map1<>(entries[0].getKey(),
entries[0].getValue());
} else {
Object[] kva = new Object[entries.length << 1];
int a = 0;
for (Entry<? extends K, ? extends V> entry : entries) {
// implicit null checks of each array slot
kva[a++] = entry.getKey();
kva[a++] = entry.getValue();
}
return new ImmutableCollections.MapN<>(kva);
}
}
static <K, V> Entry<K, V> entry(K k, V v) {
// KeyValueHolder checks for nulls
return new KeyValueHolder<>(k, v);
}
@SuppressWarnings({"rawtypes","unchecked"})
static <K, V> Map<K, V> copyOf(Map<? extends K, ? extends V> map) {
if (map instanceof ImmutableCollections.AbstractImmutableMap) {
return (Map<K,V>)map;
} else {
return (Map<K,V>)Map.ofEntries(map.entrySet().toArray(new Entry[0]));
}
}
}
最常用的实现类是HashMap
,采用数组+链表+红黑树实现,也就是分离链表法(拉链法)实现的哈希表。简而言之就是用一个大数组存元素,每个不同元素都有一个特定的哈希值通过某种计算之后得到一个数组下标,然后这个元素就存在这个下标的位置,如果哈希冲突了(两个不同元素哈希值相同或者通过哈希值计算得到的下标相同)就用链表将下标相同的键值对链起来,如果链表长度超过8,则将链表转换为红黑树以提高查找效率。哈希表分配了数组之后数组大小是确定的,因为需要利用这个大小和哈希值来计算索引,在往哈希表中添加元素的过程中,必然会导致哈希冲突越来越频繁,当达到某一个阈值时基于效率考虑需要对哈希表进行扩容,重新分配更大的数组,并且根据哈希值重算所有元素的下标(再哈希,rehash)。扩容时机选择、哈希函数的编写、哈希冲突的解决方案都会影响哈希表的性能。
常用方法:get
put
remove
containsKey
keySet
entrySet
遍历:
for each
循环遍历keySet
返回的集合for each
遍历entrySet()
集合,同时遍历key
和value
特点:
- 哈希表特性:不保证按插入顺序存储,也无法对元素排序,最佳
O(1)
的访问、插入、删除、按key查找时间复杂度。 - 使用
key
的hashCode()
作为哈希值,key
的值作为发生哈希冲突时辅助判断的方法。
正确使用Map
必须保证:
- 判断
key
相等依然是通过equals
方法,所以要正确覆写key
类型的equals
方法。 - 作为
key
还需要正确覆写int hashCode()
方法以获取哈希值。要求:- 如果对象相等(
equals()
返回true
),那么哈希值必须相等。必须满足以保证正确性。 - 两个对象不相等,尽量保证两个对象的
hashCode()
不相等。尽量保证以减少哈希冲突,提高查找效率。
- 如果对象相等(
- 编写
equals(
)和hashCode()
遵循的原则是:equals()
用到的用于比较的每一个字段,都必须在hashCode()
中用于计算,equals()
中没有使用到的字段,绝不可放在hashCode()
中计算。 对于value
对象则没有任何要求。
equals
和hashCode
编写实例:
class Person {
private String name;
private int age;
public Person(String name, int age) {
this.name = name;
this.age = age;
}
public boolean equals(Person other) {
return name.equals(other.name) && age == other.age;
}
public int hashCode() {
return name.hashCode() * 31 + age;
}
}
hashCode
需要用到每一个参与equals
比较的字段,一种常见方法是:迭代逐次将每一轮的哈希值乘以一个素数并加上下一个字段的哈希值,直到所有字段都参与计算。
上述Person.hashCode
其实还有一点问题,如果name
为null
那么就直接NullPointerException
了,所以经常借助Objects.hash()
来计算哈希值。它的实现是差不多一样的逻辑:
public final class Objects {
ublic static int hash(Object... values) {
return Arrays.hashCode(values);
}
}
public class Arrays {
public static int hashCode(Object a[]) {
if (a == null)
return 0;
int result = 1;
for (Object element : a)
result = 31 * result + (element == null ? 0 : element.hashCode());
return result;
}
}
最一般的通过哈希值计算下标的方式就是直接取低位或者做取余操作。取低位操作计算量小,且实现时默认尺寸是16,每次扩容都是扩容为原先的2倍,HashMap
就是采用取低位的方式。
int index = key.hashCode() & 0xf; // 数组大小默认是16,直接取低4位
int index = key.hashCode() % arraySize; // 计算量相对取低位来说就大了一点
HashMap
内部其实使用提供的哈希值又做了一次计算然后才用来计算下标。在低16位加入了高16位的扰动(将高16位异或到了低16位),因为直接取低位的方式会导致元素不多数组不大时高位用不到,加入高位扰动后可以进一步将低哈希冲突的概率。
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
TODO:详细分析HashMap
实现。
如果Map
的key
是enum
的话,还可以使用java.util.EnumMap
,可以在内部以一个非常紧凑的数组存储value
,并不需要计算hashCode()
,不但效率最高,而且没有额外的空间浪费。当然其实如果是其他语言可能直接用enum
转整数作为下标,new
一个数组直接存其实就行了。
定义:
public class EnumMap<K extends Enum<K>, V> extends AbstractMap<K, V> implements java.io.Serializable, Cloneable
使用时直接使用Map<K,V>
接口来使用即可。和使用HashMap
没有任何区别。
HashMap
以哈希表来实现就决定了它的元素是无序的,当我们需要Map
的元素有序时可以使用SortedMap
接口以及实现类TreeMap
。
对应于C++的容器来说TreeMap
就对应于std::map
,而HashMap
则对应于std::unordered_map
。
派生关系:
Map
|__HashMap
|__SortedMap
|__TreeMap
SortedMap
保证遍历时以key
的顺序进行排序,具体的排序规则则由传入的Comparable
接口决定。对于没有实现Comparable
的接口的key
,则需要在构造TreeMap
时传入一个自定义的排序算法。相关方法:
public class TreeMap<K,V>
extends AbstractMap<K,V>
implements NavigableMap<K,V>, Cloneable, java.io.Serializable
{
private final Comparator<? super K> comparator;
public TreeMap() {
comparator = null;
}
public TreeMap(Comparator<? super K> comparator) {
this.comparator = comparator;
}
@SuppressWarnings("unchecked")
final int compare(Object k1, Object k2) {
return comparator==null ? ((Comparable<? super K>)k1).compareTo((K)k2)
: comparator.compare((K)k1, (K)k2);
}
}
当调用key
的比较方法compare
时,首先使用构造时传入的Comparator
对象,如果构造时没有传则为null
,则使用key
实现的Comparable
接口的compareTo
方法比较。
如果使用Comparator
对象的,需要针对这个类编写新的类实现Comparator
接口,Comparator
需要能够读取需要用于比较的key
的成员,就必须实现相关的getter
方法,直接在key
中实现Comparable
接口相对来说更为简单一些。如果多个TreeMap
需要多种方式比较可以通过实现多个Comparator
接口来做到。
实现Comparable.compareTo
或者Comparator.compare
接口时,都是如果小于则返回负数,通常是-1
,相等返回0
,大于返回正数,通常是1
。实现时应该按照规范,相等时必须返回0
,不然查找时就查找不到了。注意使用TreeMap
就不强制要求实现equals
和hashCode
方法了。
TreeMap
是按照升序排列的,也就是遍历得到的结果一定满足前者与后者比较结果为负。需要按照不同规则排序的话,可以实现不同的比较接口。
看一下SortedMap
接口提供了哪些特有的方法,并且其实在SortedMap
和TreeMap
之间还有一层NavigableMap
。主要是子Map
和各种查找操作。
public interface SortedMap<K,V> extends Map<K,V> {
Comparator<? super K> comparator(); // 比较操作
SortedMap<K,V> subMap(K fromKey, K toKey); // from inclusive, to exclusive
SortedMap<K,V> headMap(K toKey);
SortedMap<K,V> tailMap(K fromKey);
K firstKey();
K lastKey();
Set<K> keySet(); // key升序集合
Collection<V> values(); // 值的集合
Set<Map.Entry<K, V>> entrySet(); // key升序排列的键值对集合
}
public interface NavigableMap<K,V> extends SortedMap<K,V> {
Map.Entry<K,V> lowerEntry(K key); // 得到最大的key小于给定的key的键值对,或者没有这样的key则返回null
K lowerKey(K key); // 同上一个不过返回的是key
Map.Entry<K,V> floorEntry(K key); // 得到最大的key小于或等于给定key的键值对,没有返回null
K floorKey(K key); // // 得到最大的小于或等于给定key的key
Map.Entry<K,V> ceilingEntry(K key); // 最小的大于等于给定key的键值对
K ceilingKey(K key); // 最小的大于等于给定key的key
Map.Entry<K,V> higherEntry(K key); // 最小的大于给定key的键值对
K higherKey(K key); // 最小的大于给定key的key
Map.Entry<K,V> firstEntry(); // 最小key,也就是第一个key,空Map则返回null
Map.Entry<K,V> lastEntry(); // 最大key,最后一个key,空Map返回null
Map.Entry<K,V> pollFirstEntry(); // 移除最小key对应元素,返回该键值对,空Map返回null
Map.Entry<K,V> pollLastEntry(); // 移除最大key对应元素
NavigableMap<K,V> descendingMap(); // 返回逆序Map,修改元素会反应到原始Map
NavigableSet<K> navigableKeySet(); // key的有序集合,升序排列
NavigableSet<K> descendingKeySet(); // key的降序集合,
NavigableMap<K,V> subMap(K fromKey, boolean fromInclusive,
K toKey, boolean toInclusive); // 子Map,见名知意
NavigableMap<K,V> headMap(K toKey, boolean inclusive); // 小于或等于给定key元素构成的Map
NavigableMap<K,V> tailMap(K fromKey, boolean inclusive); // 大于或等于给定key元素构成的Map
SortedMap<K,V> subMap(K fromKey, K toKey); // subMap(fromKey, true, toKey, false)
SortedMap<K,V> headMap(K toKey); // headMap(toKey, false)
SortedMap<K,V> tailMap(K fromKey); // tailMap(fromKey, true)
}
编写应用程序时,通常要读写配置文件,配置文件通常来说Key-Value
是String-String
类型的,因此可以用Map<String, String>
来表示。如:
account=32767
username=tikot
java集合库提供了一个Properties
来表示一组配置,由于历史遗留原因,Properties
是从Hashtable
派生的,但只需要用到Properties
本身的方法。
Java默认配置文件以.properties
为扩展名,以#
为注释,如:
# account.properties
account=32767
username=tikot
读写修改配置文件:
public class Main {
public static void main(String[] args) throws Exception {
String file = "account.properties";
Properties props = new Properties();
props.load(new java.io.FileInputStream(file));
System.out.println(props.getProperty("account"));
System.out.println(props.getProperty("username"));
props.setProperty("locatoin", "mars");
props.store(new FileOutputStream(file), "this is comment");
}
}
相关方法:
load
从流读取配置store
将配置写入流getProperty()
setProperty()
获取和修改配置
总结:
- Java集合库提供的
Properties
用于读写配置文件.properties
。.properties
文件可以使用UTF-8
编码 - 可以从文件系统、
classpath
或其他任何地方读取.properties
文件。 - 读写时调用
getProperty()
、setProperty()
方法,不要使用从基类重写的方法put
set
。 FileInputStream
表示字节流,使用表示字符流的FileReader
重载版本指定字节编码可以更好的处理文件编码。
如果只需要存储不重复的key
,不需要存储value
,则可以使用Set
。定义:
public interface Set<E> extends Collection<E> {
// Query Operations
int size();
boolean isEmpty();
boolean contains(Object o);
Iterator<E> iterator();
Object[] toArray(); // 转数组,元素按照迭代器顺序
<T> T[] toArray(T[] a);
// Modification Operations
boolean add(E e);
boolean remove(Object o);
// Bulk Operations
boolean containsAll(Collection<?> c);
boolean addAll(Collection<? extends E> c);
boolean retainAll(Collection<?> c);
boolean removeAll(Collection<?> c);
void clear();
// Comparison and hashing
boolean equals(Object o);
int hashCode();
@Override
default Spliterator<E> spliterator() {
return Spliterators.spliterator(this, Spliterator.DISTINCT);
}
@SuppressWarnings("unchecked")
static <E> Set<E> of() {
return (Set<E>) ImmutableCollections.EMPTY_SET;
}
// ... 多个参数和可变参数的of
// 由Collection创建Set
@SuppressWarnings("unchecked")
static <E> Set<E> copyOf(Collection<? extends E> coll) {
if (coll instanceof ImmutableCollections.AbstractImmutableSet) {
return (Set<E>)coll;
} else {
return (Set<E>)Set.of(new HashSet<>(coll).toArray());
}
}
}
除了从Collection
继承而来的方法外,主要操作为:
add
remove
添加移除contains
isEmpty
是否包含特定元素、判空
Set
就相当于只存储key
,不存储value
的Map
,经常使用Set
来去重。
实现:
HashSet
无序,类似于HashMap
是哈希表实现,所以需要key
正确实现equals
和hashCode
方法。TreeSet
有序,实现了SortedSet
接口,同TreeMap
红黑树实现,需要构造时传入key
的Comparator
或者key
正确实现Comparable
接口。
队列,即先进先出的有序表,定义:
public interface Queue<E> extends Collection<E> {
boolean add(E e); // 入队
boolean offer(E e); // 入队
E remove(); // 出队
E poll(); // 出队
E element(); // 队首元素
E peek(); // 队首元素
}
相同操作的不同方法的区别仅在于队满或队空时的行为是抛异常还是仅返回一个null
或false
,add
remove
element
会抛异常,offer
队满(达到了容量限制的大小)时返回false
,poll
和peek
队空时返回null
。
注意应该避免把null
添加到队列,不然peek
poll
返回null
就无法判断是队空了还是返回了一个null
元素。
可以注意到LinkedList
实现了Queue
接口,并且中间还有一层Deque
。
即优先队列,PriorityQueue
实现了Queue
接口,对PriorityQueue
调用remove
或者poll
,出队时总是优先级最高的元素。
我们需要提供比较接口:实现Comparable
接口或者传入Comparator
对象,以便能够通过比较确定优先级。
PriorityQueue
是实现类,使用时直接使用new
,直接使用实现的Queue
接口的方法即可。
优先队列通常用堆实现,入队出队提供O(logn)
的平均时间复杂度,TreeMap
可以提供优先队列能够做到的所有操作,只是应该会占用更多空间,特定场景下还是可以使用PriorityQueue
。
双端队列,也就是同时提供了堆和栈操作的队列,即同时提供队头队尾插入移除的操作。
操作\接口 | Queue |
Deque |
---|---|---|
添加元素到队尾 | add(E e) / offer(E e) |
addLast(E e) / offerLast(E e) |
取队首元素并删除 | E remove() / E poll() |
E removeFirst() / E pollFirst() |
取队首元素但不删除 | E element() / E peek() |
E getFirst() / E peekFirst() |
添加元素到队首 | 无 | addFirst(E e) / offerFirst(E e) |
取队尾元素并删除 | 无 | E removeLast() / E pollLast() |
取队尾元素但不删除 | 无 | E getLast() / E peekLast() |
定义:public interface Deque<E> extends Queue<E>
Deque
是从Qeuee
派生的,所以其实也可以用Queue
的offer
/poll
方法,其实就等同与offerLast
/pollFirst()
,但如果使用Deque
接口,还是最好调用它自己的方法,这样更能明确表明自己在做什么事情。
实现类:
ArrayDeque
,数组实现。LinkedList
,链表。
虽然像LinkedList
这种实现了List
Queue
Deque
等多个接口,但一般来说我们在使用时总是通过特定的接口来使用它,而不是直接持有一个LinkedList
,因为持有接口说明代码的抽象层次更高,而接口本身定义的方法代表了特定的用途。
面向抽象编程:尽量持有接口,而不是具体的实现类。
栈,即后进先出表,定义:
public class Stack<E> extends Vector<E> {
public Stack() {
}
public E push(E item) { // 压栈
addElement(item);
return item;
}
public synchronized E pop() { // 出栈
E obj;
int len = size();
obj = peek();
removeElementAt(len - 1);
return obj;
}
public synchronized E peek() { // 取栈顶元素
int len = size();
if (len == 0)
throw new EmptyStackException();
return elementAt(len - 1);
}
public boolean empty() { // 判空
return size() == 0;
}
public synchronized int search(Object o) { // 到栈顶距离,栈顶返回1
int i = lastIndexOf(o);
if (i >= 0) {
return size() - i;
}
return -1;
}
@java.io.Serial
private static final long serialVersionUID = 1224463164541339165L;
}
可以看到Stack
已经是实现类了,而不是接口,派生自Vector
。
Vector
和ArrayList
一样,都是List
的动态数组实现,不同于ArrayList
的是,它支持多线程的同步,同一时刻只能有一个线程能够写Vector
,也就是Vector
是线程安全的,但实现同步需要花费更多代价,所以性能不如ArrayList
。
为什么Stack
是实现类,而不是接口呢?前面其实也说过,Vector
和Stack
都是历史遗留的不再推荐使用的类型。因为已经有了名为Stack
的类,基于兼容性考虑,没有再定义接口。日常使用的话双端队列Deque
拥有所有栈该有的功能。
Java的集合类可以使用for each
循环:
List<String> list = new ArrayList("hello", "world");
for (String s : list) {
System.out.println(s);
}
但是实际上,java编译器并不知道如何遍历List
,能够编译通过的原因是编译器把范围for
循环改成了普通的for
循环:
for (Interator<String> it = list.iterator(); it.hasNext(); ) {
System.out.println(it.next());
}
使用迭代器的好处在于,调用方总是可以通过统一的方式遍历所有集合,不必关心他们的内部存储结构。如果关心存储结构,那么遍历ArrayList
就要使用下标,遍历链表就要使用表节点(因为使用下标会有效率问题)。但是使用迭代器可以将这两种方式统一起来,统一形式并且达到最好的效率,只是需要由实现类来实现迭代器的高效遍历访问。
先看一下Interator
的定义:
public interface Iterator<E> {
boolean hasNext(); // 是否存在下一个元素
E next(); // 得到下一个元素,如果没有则抛出NoSuchElementException
// 移除上一个next返回的元素,每次next只能调用一次remove,不支持该操作抛
// UnsupportedOperationException,调用前没有调用next抛IllegalStateException
default void remove() {
throw new UnsupportedOperationException("remove");
}
// 对每一个指定元素执行给定操作,直到结尾,迭代过程中修改元素会导致未定义行为,除非实现类定义了对应的并发策略
default void forEachRemaining(Consumer<? super E> action) {
Objects.requireNonNull(action);
while (hasNext())
action.accept(next());
}
}
非常简单,只需要实现hasNext
和next
方法,就可以支持遍历了,如果要支持删除元素,还要实现remove
,最后的forEachRemaining
是给for each
循环来用的,如果不需要支持并发通常不需要再在实现类重写。
实现一个简单的可变数组类作为例子:
public class MyArray<T> implements Iterable<T>{
private Object[] arr = null;
private int size = 0;
public MyArray(int capacity) {
if (capacity > 0) {
arr = new Object[capacity];
}
else {
arr = new Object[8];
}
size = 0;
}
public MyArray() {
arr = new Object[8];
size = 0;
}
public boolean isEmpty() {
return size == 0;
}
public T get(int index) {
checkIndex(index);
return (T)arr[index];
}
public void set(int index, T obj) {
checkIndex(index);
arr[index] = obj;
}
public void add(T obj) {
if (size == arr.length) {
grow();
}
arr[size++] = obj;
}
public T removeAt(int index) {
checkIndex(index);
T elem = (T)arr[index];
for (int i = index+1; i < size; i ++) {
arr[i-1] = arr[i];
}
arr[size-1] = null;
size--;
return elem;
}
private void grow() {
int oldCapacity = arr.length;
Object[] newArr = new Object[oldCapacity*2];
for (int i = 0; i < arr.length; i ++) {
newArr[i] = arr[i];
}
arr = newArr;
}
private void checkIndex(int index) {
if (index < 0 || index >= size) {
throw new IllegalArgumentException("Illegal index: " + index);
}
}
// TODO : other method about equals, hashCode, subArray, searching, sorting, etc.
@Override
public Iterator<T> iterator() {
return new MyArrayIterator();
}
private class MyArrayIterator implements Iterator<T> {
private int index = 0;
private boolean bNext = false;
public MyArrayIterator() {
}
@Override
public boolean hasNext() {
return index < MyArray.this.size;
}
@Override
public T next() {
bNext = true;
return (T)MyArray.this.get(index++);
}
@Override
public void remove() {
if (bNext == false) {
throw new IllegalStateException("there is no last next() called.");
}
MyArray.this.removeAt(--index);
bNext = false;
}
}
}
这只是最小功能简化,正常实现比如ArrayList
要达到可用需要考虑比较多的东西。此时就可以用for each
循环或者迭代器去迭代这个类了:
MyArray<String> arr = new MyArray(10);
arr.add("hello");
arr.add("world");
arr.add("nice");
arr.removeAt(1);
for (Iterator<String> it = arr.iterator(); it.hasNext();) {
System.out.println("elem: " + it.next());
it.remove();
}
总结:
Iterator
是一种抽象的数据访问模型,好处有:- 对任何集合都采用一种访问模型。
- 调用者对集合内部结构一无所知。
- 集合类返回的
Iterator
对象知道该如何迭代。
Collections
是JDK提供的工具类,同样位于java.util
包中,注意末尾有s,区别于Collection
接口。它提供了一系列静态方法,能更方便地操作各种集合。
创建空集合:
public static final <T> List<T> emptyList()
public static final <K,V> Map<K,V> emptyMap()
public static final <T> Set<T> emptySet()
- 注意返回的空集合是不可变集合,无法向其中添加或者删除元素。
- 也可以使用各个集合接口提供的
of(T...)
方法来创建空集合,比如List.of()
和Collections.emptyList()
就是等价的。
创建单元素集合:
public static <T> List<T> singletonList(T o)
public static <K,V> Map<K,V> singletonMap(K key, V value)
public static <T> Set<T> singleton(T o) // 单元素Set
单元素集合也是不可变集合,不可添加元素,空集合和单元素集合都是有Collections
的静态嵌套类实现。
排序:
public static <T extends Comparable<? super T>> void sort(List<T> list)
public static <T> void sort(List<T> list, Comparator<? super T> c)
排序会改变元素,所以参数需要是可变的List
。
洗牌:
public static void shuffle(List<?> list)
public static void shuffle(List<?> list, Random rnd)
传入有序的List
,随机打乱List
内部元素顺序。
不可变集合:
Collections
提供了方法将可变集合封装为不可变集合。都是有内部的静态嵌套类实现,实际上是通过创建代理对象,拦截掉所有修改方法实现。
public static <T> List<T> unmodifiableList(List<? extends T> list)
public static <K,V> Map<K,V> unmodifiableMap(Map<? extends K, ? extends V> m)
public static <T> Set<T> unmodifiableSet(Set<? extends T> s)
然而改变原始的可变集合是可以进行修改的,并且会影响到封装后的不可变集合。
线程安全集合:
public static <T> List<T> synchronizedList(List<T> list)
public static <K,V> Map<K,V> synchronizedMap(Map<K,V> m)
public static <T> Set<T> synchronizedSet(Set<T> s)
上述方法将线程不安全的集合变为线程安全的集合,Java5开始,引入了更高效的并发集合类,上述的同步方法已经没什么用了。
Collections
还有很多其他方法。
输入输出:
- 输入,即是从外部读入数据到内存。例如从磁盘、网络、用户输入等。读到内存之后无非就是用字节数组
byte[]
或者字符数组char[]
表示。 - 输出,将数据从内存输出到外部。例如输出到磁盘、网络、屏幕等。输出也就是将
byte[]
或者char[]
写到文件或者其他位置。 InputStream
/OutputStream
是以字节为最小传输单位的输入输出流,也称字节流。Reader
/Writer
是以字符char
为最小传输单位的输入输出流,也成字符流。本质上Reader
和Writer
就是能够自动编码解码的字节流。Reader
读取是将字节流解码转换为字符流,Writer
将数据写入前会先将字符流编码为字节流。- 输入输出流是单向流动的。
同步IO与异步IO:
- 读写IO是代码必须等待数据返回后才继续执行后续代码,优点是代码简单,缺点是CPU效率低(因为CPU速度远高于IO速度)。
- 异步IO是指,读写IO时仅发送请求,然后立刻执行后续代码,优点是CPU执行效率高,缺点是代码编写复杂。
Java标准库提供了java.io
同步IO以及java.nio
异步IO。上述流相关的类都是同步IO的抽象类。这里只讨论同步IO。
Java用java.io.File
来操作文件和目录,构建一个File
对象需要传入路径。路径可以是绝对或者相对路径,或者绝对路径中使用..
表示的相对路径。其中路径分隔符,windows中是\\
,Linux中是/
。
三种路径:
getPath
传入路径getAbsolutePath
绝对路径,传入相对路径中的.
或者..
不会被展开,而是直接拼接到当前目录上。getCanonicalPath
规范路径,展开传入相对路径中的.
或者..
,得到文件的绝对路径。
因为Windows和Linux路径分隔符不同,在File
中用静态字段File.separator
字符串表示。
File
既可以表示文件,也可以表示目录,构建File
时,即使传入路径不存在,也不会出错,调用File
对象某些方法时才会真正进行磁盘操作。
File
属性:
public boolean isFile()
public boolean isDirectory()
public boolean isAbsolute()
public boolean isHidden()
文件读写权限和大小:
public boolean canRead()
public boolean canWrite()
public boolean canExecute()
public boolean exists()
public long length() // 文件大小,如果是目录,返回值不确定
对目录而言,是否能够执行代表能够列出它包含的文件和子目录。
创建删除文件:创建文件是先检查文件,如果不存在则创建一个空文件,检查和创建对文件系统来说是原子操作。
public boolean createNewFile() throws IOException
public boolean delete()
临时文件:使用createTempFile
创建临时对象,如果调用了deleteOnExit
则会在JVM退出时自动删除。
public static File createTempFile(String prefix, String suffix) throws IOException
public static File createTempFile(String prefix, String suffix, File directory)
public void deleteOnExit()
遍历文件和目录:
public String[] list()
public String[] list(FilenameFilter filter)
public File[] listFiles()
public File[] listFiles(FilenameFilter filter)
public File[] listFiles(FileFilter filter)
public static File[] listRoots() // 列出文件系统所有根目录
目录操作:
public boolean mkdir() // 只能创建最后一级目录
public boolean mkdirs() // 如果中间目录不存在也会创建
public boolean delete() // 目录为空才能成功
java标准库还提供了Path
对象,位于java.nio.file
包,和File
对象类似,但操作更为简单。如果需要对目录进行复杂的拼接遍历等操作,使用Path
对象更为方便。
有了File
类就可以写一个简单的文件操作命令了,简单实现ls
mkdir
touch
tree
rm
cp
mv
命令,不支持任何选项,只支持字面上的功能,列出当前目录所有文件、创建目录、创建新文件、树形结构列出所有文件、移除文件或目录、复制、移动文件。再来一个简单的命令循环就可以模拟一个简陋至极的shell
了。
import java.io.File;
import java.io.IOException;
import java.nio.file.Files;
import java.nio.file.Path;
import java.util.Scanner;
import java.util.StringJoiner;
public class FileOp {
private File curDir = null;
public FileOp() {
curDir = new File(System.getProperty("user.dir"));
}
public FileOp(File inputFile) throws IOException {
if (inputFile == null || !inputFile.exists()) {
curDir = new File(System.getProperty("user.dir"));
} else if (inputFile.isDirectory()) {
curDir = new File(inputFile.getParent());
} else {
curDir = new File(inputFile.getCanonicalPath());
}
}
public void run() throws IOException {
if (curDir == null) {
return;
}
Scanner sc = new Scanner(System.in);
boolean bContinue = true;
do {
System.out.print(curDir.getCanonicalPath() + " > ");
String cmd = sc.nextLine();
cmd.trim();
if (cmd.isEmpty()) {
continue;
}
String[] args = cmd.split("[\\s]+"); // 正则表达式,匹配一个或多个空白符
for (int i = 0; i < args.length; i++) {
args[i].trim();
}
if (args.length == 0) {
continue;
}
switch (args[0]) {
case "ls":
if (args.length == 1) {
ls(curDir.getPath());
} else if (args.length == 2) {
ls(args[1]);
} else {
System.out.println("invalid args of ls : " + cmd);
}
break;
case "cd":
if (args.length == 2) {
cd(args[1]);
} else if (args.length >= 3) {
System.out.println("invalid args of cd : " + cmd);
}
break;
case "mkdir":
if (args.length == 2) {
mkdir(args[1]);
} else {
System.out.println("invalid args of mkdir : " + cmd);
}
break;
case "touch":
if (args.length == 2) {
touch(args[1]);
} else {
System.out.println("invalid args of touch : " + cmd);
}
break;
case "tree":
if (args.length == 1) {
tree(curDir.getCanonicalPath());
} else if (args.length == 2) {
tree(args[1]);
} else {
System.out.println("invalid args of tree : " + cmd);
}
break;
case "rm":
if (args.length == 2) {
rm(args[1]);
} else {
System.out.println("invalid args of rm : " + cmd);
}
break;
case "cp":
if (args.length == 3) {
cp(args[1], args[2]);
} else {
System.out.println("invalid args of cp : " + cmd);
}
break;
case "mv":
if (args.length == 3) {
mv(args[1], args[2]);
} else {
System.out.println("invalid args of mv : " + cmd);
}
break;
case "exit":
bContinue = false;
break;
default:
System.out.println("invalid args : " + cmd);
break;
}
} while (bContinue);
sc.close();
}
public void ls(String lsFile) {
lsFile = realToAbs(lsFile);
File f = new File(lsFile);
if (!f.exists()) {
System.out.println("non-exist file or directories : " + lsFile);
} else if (f.isFile()) {
System.out.println(f.getName());
} else {
File[] files = f.listFiles();
StringJoiner sj = new StringJoiner(" ");
for (int i = 0; i < files.length; i++) {
if (files[i].isFile()) {
sj.add(files[i].getName());
} else {
sj.add(files[i].getName() + "/");
}
}
if (files.length > 0) {
System.out.println(sj);
}
}
}
public void cd(String cdDir) {
cdDir = realToAbs(cdDir);
File f = new File(cdDir);
if (f.exists() && f.isDirectory()) {
curDir = f;
} else {
System.out.println("invalid directory path : " + cdDir);
}
}
public void mkdir(String mkDir) {
mkDir = realToAbs(mkDir);
File f = new File(mkDir);
if (f.isDirectory()) {
System.out.println("directory already exists : " + mkDir);
} else if (f.isFile()) {
System.out.println("a same name file already exists : " + mkDir);
} else if (!f.mkdir()) {
System.out.println("failed to mkdir : " + mkDir);
}
}
public void touch(String newFile) {
newFile = realToAbs(newFile);
File f = new File(newFile);
if (f.isDirectory()) {
System.out.println("a same neme directory already exists : " + newFile);
} else if (f.isFile()) {
System.out.println("file alredy exists : " + newFile);
} else {
try {
if (!f.createNewFile()) {
System.out.println("failed to create new file : " + newFile);
}
} catch (IOException e) {
System.out.println("failed to create new file : " + newFile);
}
}
}
public void tree(String inputFile) {
inputFile = realToAbs(inputFile);
File f = new File(inputFile);
if (!f.exists()) {
System.out.println("file or directory does not exist : " + inputFile);
} else if (f.isFile()) {
ls(inputFile);
} else if (f.isDirectory()) {
System.out.println(inputFile);
printFileOrDirWithTreeFormat(f, 0);
}
}
private void printFileOrDirWithTreeFormat(File f, int indent) {
for (int i = 0; i < indent; i++) {
System.out.print(" ");
}
if (f.isDirectory()) {
System.out.println(f.getName() + "/");
File[] files = f.listFiles();
for (File tmpFile : files) {
printFileOrDirWithTreeFormat(tmpFile, indent + 1);
}
} else if (f.isFile()) {
System.out.println(f.getName());
}
}
public void rm(String inputFile) {
inputFile = realToAbs(inputFile);
File f = new File(inputFile);
if (f.exists()) {
if (!f.delete()) {
System.out.println("fialed to delte file or directory : " + inputFile);
}
} else {
System.out.println("file or directory does not exist : " + inputFile);
}
}
public void cp(String fromFile, String toFile) {
File f = new File(realToAbs(fromFile));
File fto = new File(realToAbs(toFile));
if (fto.exists()) {
System.out.println("destination file or directory already exists : " + toFile);
} else if (f.exists()) {
try {
Files.copy(f.toPath(), fto.toPath());
} catch (IOException e) {
System.out.printf("fialed to copy %s to %s\n", fromFile, toFile);
}
} else {
System.out.println("source file does not exist : " + fromFile);
}
}
public void mv(String fromFile, String toFile) {
File f = new File(realToAbs(fromFile));
File fto = new File(realToAbs(toFile));
if (fto.exists()) {
System.out.println("destination file or directory already exists : " + toFile);
} else if (f.exists()) {
if (!f.renameTo(fto)) {
System.out.printf("failed to move %s to %s\n", fromFile, toFile);
}
} else {
System.out.println("source file does not exist : " + fromFile);
}
}
// common logic
private String realToAbs(String path) {
path.replace('/', File.separatorChar);
path.replace('\\', File.separatorChar);
Path p = Path.of(path);
if (!p.isAbsolute()) {
path = curDir.getPath() + File.separator + p;
}
return path;
}
}
虽然极端简陋,但也具备了最基本的文件操作可用性了,类UNIX系统中每个命令都支持多个选项,功能丰富太多了。TODO:有空时阅读Linux系统的简单命令实现源码。
输入流:
public abstract class InputStream implements Closeable {
private static final int MAX_SKIP_BUFFER_SIZE = 2048;
private static final int DEFAULT_BUFFER_SIZE = 8192;
public InputStream() {}
public static InputStream nullInputStream() { ... } // 返回一个打开的不读取任何自己的匿名派生类对象
public abstract int read() throws IOException; // 从输入流中读取下一个字节,返回0~255,到达了流的末尾则返回-1
public int read(byte b[]) throws IOException {
return read(b, 0, b.length);
} // 读取固定长度字节到数组中,返回实际读取到的字节数,到达了流的末尾返回-1
public int read(byte b[], int off, int len) throws IOException {
Objects.checkFromIndexSize(off, len, b.length);
if (len == 0) {
return 0;
}
int c = read();
if (c == -1) {
return -1;
}
b[off] = (byte)c;
int i = 1;
try {
for (; i < len ; i++) {
c = read();
if (c == -1) {
break;
}
b[off + i] = (byte)c;
}
} catch (IOException ee) {
}
return i;
} // 读取固定长度字节到数组,返回实际读取到的长度,鼓励在派生类中重写为更高效的实现
private static final int MAX_BUFFER_SIZE = Integer.MAX_VALUE - 8;
public byte[] readAllBytes() throws IOException {
return readNBytes(Integer.MAX_VALUE);
} // 读取输入流所有字节的方便实现,不鼓励用来读取量非常大的数据(会阻塞线程+大量内存占用)
public byte[] readNBytes(int len) throws IOException { ... } // 读取固定长度字节
public int readNBytes(byte[] b, int off, int len) throws IOException { } // 读取固定长度字节
public long skip(long n) throws IOException { ... } // 跳过n个字节,返回实际跳过的字节数
public void skipNBytes(long n) throws IOException { ... } // 跳过n字节,不够n字节抛异常
public int available() throws IOException {
return 0;
} // 子类应该重写,返回可用的字节数,返回估计流中还剩余的字节数,可能并不准确,不要用返回结果去分配内存来存储所有数据
public void close() throws IOException {} // 关闭流释放资源,子类应该重写
public synchronized void mark(int readlimit) {} // 标记一个位置,reset时将流重新定位到这个位置
public synchronized void reset() throws IOException {
throw new IOException("mark/reset not supported");
}
public boolean markSupported() {
return false;
}
public long transferTo(OutputStream out) throws IOException { ... } // 输入流数据转移到输出流
}
InputStream
是一个抽象类,最重要的就是read
相关的读取方法,读取完之后需要close
(来自Closeable extends AutoCloseable
),
计算机中,文件、网络端口等资源由操作系统管理,应用程序运行中,可能会出现IO错误,比如文件没有读写权限,不存在等情况,底层错误由虚拟机封装为IOException
抛出,所以所有IO操作都必须正确处理IOException
。并且需要关闭流以释放系统资源。
用try-finally
保证无论是否发生IO错误流都能够关闭是一种常见写法:
InputStream is = null;
try {
is = new FileInputStream("readme.txt");
while (true) {
int n = is.read();
if (n != -1) {
System.out.println(n);
}
else {
break;
}
}
} finally {
if (is != null) {
is.close();
}
}
这样会有一点繁琐,更好的写法是使用Java7引入的try(resource)
语法,只需要写try
让编译器自动为我们关闭资源。
try (InputStream is = new FileInputStream("readme.txt")) {
while (true) {
int n = is.read();
if (n != -1) {
System.out.println(n);
}
else {
break;
}
}
} // 编译器自动在此处添加finally并调用close
实际上编译器只看try(resource = ...)
中的对象是否实现了java.lang.AutoCloseable
,如果实现了就自动加上finally
并close
。
缓冲:读取流时一次读一个字节并不高效,一次性读取多个字节到缓冲区往往比一次一个字节高效很多,InputStream
提供了多个read
和相关接口来读取多个字节到字节数组。
阻塞:同步IO在读取时会阻塞,也就是说read
语句会读取到数据之后才返回执行下一条语句,读取IO的操作相比普通的计算操作速度会慢很多。
实现:InputStream
是一个抽象类,具体的实现在实现类中,FileInputStream
获取文件输入流就是一个典型。此外ByteArrayInputStream
可以在内存中模拟一个输入流,实际上就是把数组变成流,实际应用不多,可以用在测试时构造一个输入流。
byte[] b = new byte[] {1, 100, 101};
try (InputStream is = new ByteArrayInputStream(b)) {
while (true) {
int n = is.read();
if (n != -1) {
System.out.println(n);
}
else {
break;
}
}
}
类似于InputStream
,输出流也是抽象类,最基本方法是write
。
public abstract class OutputStream implements Closeable, Flushable {
public OutputStream() {}
public static OutputStream nullOutputStream() { ... } // 得到一个丢弃所有字节的打开的输出流
public abstract void write(int b) throws IOException; // 写一个字节到输出流,只写低8字节,高24字节忽略
public void write(byte b[]) throws IOException { // 写多个字节
write(b, 0, b.length);
}
public void write(byte b[], int off, int len) throws IOException {
Objects.checkFromIndexSize(off, len, b.length);
// len == 0 condition implicitly handled by loop bounds
for (int i = 0 ; i < len ; i++) {
write(b[off + i]);
}
}
public void flush() throws IOException {
} // 如果实现类中缓冲了已写的字节,那么这个接口的调用会将缓冲的字节实际交给操作系统去写
public void close() throws IOException {
}
}
和InputStream
一样,需要关闭和处理IO错误,write
时同样会阻塞。
try (OutputStream os = new FileOutputStream("readme.txt")) {
os.write("how are you!".getBytes("utf-8"));
}
其实InputStream
和OutputStream
都有缓冲区,只是InputStream
的缓冲区不会被感知到,打开输入流时,操作系统会一次性读取若干字节到缓冲区,read
读完之后会再次读取并填满缓冲区。而OutputStream
的缓冲区会被感知到,因为缓冲区不满时操作系统并不会真正去执行IO操作,所以提供了flush
给我们去手动刷新缓冲区,当然缓冲区满了或者关闭输出流时都会自动调用flush
。如果是文件输出流可能影响不大,但如果是网络输出流那可能就需要视场景调用flush
了。
实现类:
FileOutputStream
文件输出流。ByteArrayOutputStream
字节数组输出流可以在内存中模拟一个OutputStream
。
复制文件:
public static void copyFile(String src, String dest) throws FileNotFoundException,IOException {
try(InputStream is = new FileInputStream(src); OutputStream os = new FileOutputStream(dest)) {
is.transferTo(os);
}
}
将流内容读取为字符串:
public static String readAsString(InputStream is) throws IOException {
StringBuilder sb = new StringBuilder();
int n = 0;
while ((n = is.read()) != -1) {
sb.append((char)n);
}
return sb.toString();
}
某些时候可能需要给输入输出流添加其他的功能,可以选择从InputStream
或者OutputStrem
派生一个类来实现,比如添加缓冲、加密解密、计算签名功能。但如果需要同时支持其中的多项功能呢?那又需要再实现派生类,因为不允许多继承那不知道要实现多少类了。为了解决依赖继承会导致子类数量爆炸的问题,JDK将InputStream
分为两类。
- 一类是直接提供数据的流:
FileInputStream
ByteArrayInputStream
ServletInputStream
etc - 一类是提供额外附加功能的流:
BufferedInputStream
DigestInputStream
CipherInputStream
etc
当我们希望给一个流提供其他功能,比如提供缓冲来提高读取效率,这时候就用BufferedInputStream
来包装这个类。
InputStream file = new FileInputStream("test.gz");
InputStream buffered = new BufferedInputStream(file);
可以多次包装,无论包装多少次,得到的流都是InputStream
,直接用InputStream
来引用它就可以正常读取。
InputStream
|__FileInputStream
|__ByteArrayInputStream
|__ServletInputStream
|__FilterInputStream // 包装类基类,只做包装,不干任何其他事情
|__BufferedInputStream
|__DataInputStream
|__CheckedInputStream
输出流类似。这种通过一个基础组件再叠加各种附加功能组件的模式称之为装饰器模式(Decorator)。让我们可以通过少量类来实现各种功能的组合。
叠加多个FilterInputStream
时,只需要持有最外层的InputStream
,最外层的InputStream
关闭时,内层的InputStream
的close
方法也会被调用。其实就是在FilterInputStream
中保存了传入的InputStream
,然后进行转调。
实现一个自己的FilterInputStream
以统计读取的总字节数:
import java.io.FilterInputStream;
import java.io.IOException;
import java.io.InputStream;
public class CountInputStream extends FilterInputStream {
private int count = 0;
protected CountInputStream(InputStream in) {
super(in);
}
@Override
public int read() throws IOException {
int n = in.read();
if (n != -1)
count ++;
return n;
}
@Override
public int read(byte b[], int off, int len) throws IOException {
int n = in.read(b, off, len);
if (n != -1) {
count += n;
}
return n;
}
public int getReadCount() {
return count;
}
}
使用:
try (InputStream is = new FileInputStream("readme.txt"); CountInputStream cis = new CountInputStream(is)) {
System.out.println(readAsString(cis));
System.out.println(cis.getReadCount());
}
ZipInputStream
是一种FilterInputStream
,提供了直接读取zip包的功能。层次结构:
InputStream
|__FilterInputStream
|__InflaterInputStream
|__ZipInputStream
|__JarInputStream
jar
包本身就是zip压缩文件,JarInputStream
相对ZipInputStream
增加的功能主要是用来读取jar中的MANIFEST.MF
。其中InflaterInputStream
和ZipInputStream
定义在java.util.zip
包,JarInputStream
定义在java.util.jar
包。
java.util.zip
包中定义了zip/gzip相关的压缩文件条目、输入输出流、校验和等相关类。
示例,当然有了读取到了数据再利用文件输出流就可以实现解压缩了:
public static void readZip(String zipfile) throws FileNotFoundException, IOException {
try (ZipInputStream zip = new ZipInputStream(new FileInputStream(zipfile))) {
ZipEntry entry = null;
while ((entry = zip.getNextEntry()) != null) {
System.out.println(entry.getName());
if (!entry.isDirectory()) {
StringBuilder sb = new StringBuilder();
int n;
while ((n = zip.read()) != -1) {
sb.append((char)n);
}
System.out.println(sb.toString());
}
}
}
}
ZipInputStream
通常用循环getNextEntry
来遍历压缩包内所有文件,其中ZipEntry
用来表示其中的一个压缩条目,用isDirectory
判断是目录还是文件,判断依据是getName
获取到的名称是否是以/
结尾的。除了这两个常用方法,还有获取校验和,创建读取修改时间等相关方法。
public boolean isDirectory() {
return name.endsWith("/");
}
写入Zip包则需要调用ZipOutputStream
,派生关系类似于ZipInputStreram
,通常是包装一个FileOutputStream
,没写入一个文件,先调用putNextEntry()
,然后用write
写入byte[]
数据,写入完毕后调用closeEntry
结束文件打包。
添加压缩文件,需要注意ZipEntry
的名称:
public static void createZip(String zipfile, File[] inputFiles) throws FileNotFoundException, IOException {
try (ZipOutputStream zip = new ZipOutputStream(new FileOutputStream(zipfile))) {
for (File file : inputFiles) {
if (file != null && file.exists()) {
writeFileToZip(zip, file, "");
}
}
}
}
public static void writeFileToZip(ZipOutputStream zip, File file, String prefix) throws IOException {
if (file.exists()) {
if (file.isDirectory()) {
String entryName = prefix + file.getName() + "/";
zip.putNextEntry(new ZipEntry(entryName));
File[] files = file.listFiles();
if (files != null) {
for (File tmpFile : files) {
writeFileToZip(zip, tmpFile, entryName);
}
}
}
else {
zip.putNextEntry(new ZipEntry(prefix + file.getName()));
try (InputStream is = new FileInputStream(file)) {
zip.write(is.readAllBytes());
}
}
}
}
利用ZIP流和文件流,实现压缩和解压缩ZIP文件就是这么简单。
TODO:了解zip以及常见的压缩算法.
如果我们读取一个配置文件、资源文件,需要指定它的路径,如果文件不在项目里面,那么需要根据当前路径指定相对路径或者直接用绝对路径。如果这个文件在classpath
里面,最终随着jar
文件一起打包,那么读取时就只需要指定它在classpath
中的路径即可。
在classpath
中的资源文件,路径总是以/
开头,获取到当前Class
对象,然后调用getResourceAsStream
就可以直接从classpath
读取任意资源。
在Eclipse中,最终资源应该放在bin
目录下,/hello.txt
资源代表的就是bin/hello.txt
资源,最终打包后就是jar
包根目录中的hello.txt
。TODO:理清楚Eclipse工程、classpath等配置的详细含义。
例:
public static void readClassPathResFile(String path) throws IOException {
try (InputStream is = ResourceHelper.class.getResourceAsStream(path)) {
if (is != null) {
System.out.println(readStreamAsString(is));
}
}
}
public static String readStreamAsString(InputStream is) throws IOException {
int n;
StringBuilder sb = new StringBuilder();
while ((n = is.read()) != -1) {
sb.append((char)n);
}
return sb.toString();
}
调用:
ResourceHelper.readClassPathResFile("/hello.txt");
如果没有该资源,getResourceAsStream
返回的InputStream
是空的,需要检查。
序列化(serialization, serialize)就是把Java对象变成二进制内容的过程,本质上就是一个byte[]
。有序列化就有反序列化(deserialization, deserialize),也就是把二进制内容byte[]
变回Java对象。
为什么要序列化:序列化后方便存储到磁盘、通过网络传输,通过反序列化再还原回一个Java对象。
一个对象要能序列化,必须要实现一个特殊的接口:java.io.Serializable
接口。这个接口没有任何方法,只起到一个标记的作用,这样的接口被称为“标记接口”。
要把一个对象序列化为byte[]
,需要使用ObjectOutputStream
,负责将一个Java对象写入字节流。这个接口既可以写入内置类型int
double
等,可以以utf-8编码写入String,也可以写入实现了Serializable
接口的对象。
同理反序列化则使用ObejctInputStream
从byte[]
读取一个Java
对象。调用readObject
读取到一个Obejct
之后做强制类型转换为特定类型。
相关重要方法:
public class ObjectOutputStream
extends OutputStream implements ObjectOutput, ObjectStreamConstants
{
public final void writeObject(Object obj) throws IOException {}
public void writeBoolean(boolean val) throws IOException {}
public void writeByte(int val) throws IOException {}
public void writeShort(int val) throws IOException {}
public void writeChar(int val) throws IOException {}
public void writeInt(int val) throws IOException {}
public void writeLong(long val) throws IOException {}
public void writeFloat(float val) throws IOException {}
public void writeDouble(double val) throws IOException {}
public void writeBytes(String str) throws IOException {}
public void writeChars(String str) throws IOException {}
public void writeUTF(String str) throws IOException {}
}
public class ObjectInputStream
extends InputStream implements ObjectInput, ObjectStreamConstants
{
public final Object readObject() {}
public byte readByte() throws IOException {}
public int readUnsignedByte() throws IOException {}
public char readChar() throws IOException {}
public short readShort() throws IOException {}
public int readUnsignedShort() throws IOException {}
public int readInt() throws IOException {}
public long readLong() throws IOException {}
public float readFloat() throws IOException {}
public double readDouble() throws IOException {}
@Deprecated
public String readLine() throws IOException {}
public String readUTF() throws IOException {}
}
readObejct
反序列化是可能抛出异常有:
ClassNotFoundException
未找到对应类。InvalidClassException
类型不匹配。extends ObjectStreamException extends IOException
对于InvalidClassException
常见情况是类的定义可能发生了细微改变,比如一个字段类型由int
改为long
导致不兼容。为了避免这种不兼容,Java的序列化允许对象定义一个特殊的serialVersionUID
静态字段。用于标识类的序列化版本,通常可由IDE自动生成。如果修改了实例字段,则需要修改这个ID。这样就可以自动阻止不匹配的class版本。
在Eclipse中,实现了Serializable
接口后,鼠标放在类名上面,就可以看到生成序列化ID的选项,一种是添加自动生成的使用类名、接口名、成员方法即属性来生成的一个64位的哈希字段,一种是缺省的比如1L
。
private static final long serialVersionUID = -5351371831194389028L;
反序列化并不会调用构造函数,而是直接用数据填充这个对象的字段,正式因为这一点,Java的反序列化机制可以不经过构造方法就可以直接创建对象,所以可能存在安全隐患。
另外静态字段不会序列化,使用transient
修饰的实例字段不会参与序列化,一般用于那种可以通过已有字段重新计算得到的字段或者业务需要不应该做序列化的字段,标准库里面经常可以看到。
private transient long fastTime;
所以Java本身提供的基于对象的序列化和反序列化既存在安全性问题,又存在兼容性问题。更好的序列化方法是通过Json这样的通用数据结构来实现。如果需要与其他语言交换数据,也必须用通用的序列化方法比如Json。
Reader
是java.io
的另一个输入流接口,代表字符输入流。读取单位是char
,和InputStream
接口的方法可以说一模一样,只是基本数据类型由byte
换成了char
。
public int read() throws IOException
public int read(char cbuf[]) throws IOException
上面两个接口前者返回0~65535
,或者到达流末尾返回-1
,后者返回读取字符数。
示例:
try (Reader reader = new FileReader("hello.txt", StandardCharsets.UTF_8)) {
int n;
StringBuilder sb = new StringBuilder();
while ((n = reader.read()) != -1) {
sb.append((char)n);
}
System.out.println(sb);
}
此时hello.txt
中的中文就可以被识别了。纯文本文件的读取是与编码相关的,FileReader
构造时最好指定编码,如果不指定会使用默认编码。
和InputStream
一样,Reader
也是资源,也需要关闭,所以最好使用try (resource)
。
java.io
也提供了同ByteArrayInputStream
类似的CharArrayReader
,使用一个char[]
在内存中模拟一个Reader
:
Reader rd = new CharArrayReader("hello".toCharArray());
StringReader
可以直接把String
作为数据源,和CharArrayReader
几乎一模一样。
Reader rd = new StringReader("hello");
实际上,处理特殊的CharArrayReader
和StringReader
,普通的Reader
都是基于InputStream
构造的。因为Reader
也需要读取字节,然后再解码成字符流。比如FileReader
:
public class FileReader extends InputStreamReader {
public FileReader(String fileName) throws FileNotFoundException {
super(new FileInputStream(fileName));
}
public FileReader(File file) throws FileNotFoundException {
super(new FileInputStream(file));
}
public FileReader(FileDescriptor fd) {
super(new FileInputStream(fd));
}
public FileReader(String fileName, Charset charset) throws IOException {
super(new FileInputStream(fileName), charset);
}
}
可以看到FileReader
基本没有做任何事情,解码和读取都是在基类做的。
作为Reader
和InputStream
之间的桥梁的就是InputStreamReader
类,InputStreamReader
接受一个InputStream
和一个编码,负责解码工作:
public class InputStreamReader extends Reader {
// constructors
private final StreamDecoder sd;
public String getEncoding() {
return sd.getEncoding();
}
public int read() throws IOException {
return sd.read();
}
public int read(char cbuf[], int offset, int length) throws IOException {
return sd.read(cbuf, offset, length);
}
public boolean ready() throws IOException {
return sd.ready();
}
public void close() throws IOException {
sd.close();
}
}
具体的解码工作由底层的一个StreamDecoder
完成,不用太关注细节。使用时只需要传入InputStream
和编码即可。
下面的写法逻辑上是等价的:
Reader reader1 = new InputStreamReader(new FileInputStream("hello.txt"), "GBK");
Reader reader2 = new FileReader("hello.txt", Charset.forName("GBK"));
注意标准字符集StandardCharsets
中是没有GBK
编码的常量的,所以需要使用字符串表示或者使用Charset.forName
来创建。
Writer
同理就是OutputStream
加上一个解码的功能。主要方法:
public void write(int c) throws IOException
public void write(char cbuf[]) throws IOException
public void write(String str) throws IOException
主要派生类:
FileWriter
CharArrayWriter
StringWriter
同理OutputStream
和Writer
之间的桥梁是OutputStreamWriter
负责输出到流并进行字符串编码。使用方法同Reader
:
try (Writer wt = new FileWriter("hello.txt", Charset.forName("GBK"))) {
wt.write("你好呀");
}
TODO:分析了解底层StreamDecoder
和StreamEncoder
字符串编解码的实现。
PrintStream是一种FilterStream
,在OutputStream
的基础上提供了各种写入数据的方法:
public void print(char c) {
write(String.valueOf(c));
}
public void print(int i) {
write(String.valueOf(i));
}
public void print(long l) {
write(String.valueOf(l));
}
public void print(float f) {
write(String.valueOf(f));
}
public void print(double d) {
write(String.valueOf(d));
}
public void print(char s[]) {
write(s);
}
public void print(String s) {
write(String.valueOf(s));
}
public void print(Object obj) {
write(String.valueOf(obj)); // (obj == null) ? "null" : obj.toString();
}
public void println() {
newLine();
}
// other println ...
public PrintStream printf(String format, Object ... args) {
return format(format, args);
}
PrintStream
与OutputStream
相比提供了一组print/println
方法用来打印各种数据类型,而且不会抛出IOException
,编写代码时,不必处理异常。
我们常用的System.out
就是PrintStream
类型。PrintStream
是一种FilterOutputStream
,所以最终输出的是byte
数据。
PrintWriter
则是扩展了Writer
接口,包装一个Writer
并提供类似的print/println/printf
等打印函数,最终输出char
数据。
另外Reader
和Writer
也是可以由FilterReader
和FilterWriter
来装饰的,不赘述。
System
类提供标准输入输出、获取外部环境变量等能力:
public final class System {
public static final InputStream in = null;
public static final PrintStream out = null;
public static final PrintStream err = null;
private static volatile SecurityManager security; // read by VM
private static volatile Console cons;
}
其中:
in
标准输入out
标准输出err
标准错误输出
类似于C语言中的stdin
stdout
stderr
,非常好理解。
使用java.nio.file.Files
和java.nio.file.Paths
这两个工具类,可以方便的处理文件操作和路径操作。
Files
提供了诸如删除、拷贝、移动、判断是否存在、读取文件数据等操作。读取数据的话如果文件过大,建议还是使用文件流进行操作。
Paths
提供的方法不多,主要的路径操作在Path
类本身。
日期:
2021-5-2
2012-12-21
时间:
20:30:28
2021-5-2 21:26:48
时间可以带日期可以不带日期,只有带日期才能准确地表示一个时刻。
时区与本地时间
世界上的不同时区,同一时刻,时间表示是不同的。中国国内都用北京时间,也就是东八区时间。
光靠时间和日期无法唯一确定一个时刻,还需要一个时区。世界上有24个时区,相邻时区时间相差1个小时。以伦敦格林尼治本初子午线为0时区的中心,往东从东1区到东12区,往西西1区到西12区,东西12时区合并做一个时区,所以共24时区,东西12时区的中心就是国际日变更线。时区是1个时区15度,但是时区并不严格按照经度划分,在海洋上基本上是按照经度划分,在陆地上按照国界线或者其他界线进行了划分,比如中国在都是统一用北京的东八区时间,全部划分到了东八区。
地球是自西往东转的,东边比西边更早看到太阳。同一时刻,西区比东区时间要早(也就是时间更小,更慢),比如北京东八区例如正午12点时英国伦敦0时区慢8小时就应该是凌晨4点,美国纽约西5区比伦敦再慢5小时,就应该是日期早一天的23点(简捷算法:12-(8-(-5)) = -1, 即前一天的23:00)。
如果穿越了国际日界线,从东12区往西12区的话(横跨太平洋中国到美国的方向),东区快就应该将时间倒退一天,从西12区到东12区(横跨太平洋美国到中国的方向),西区慢就应该将时间前进一天。
表示本地时间就需要加上时区,时区有几种表示方式。
- 一种是
GMT
或者UTC
加上时区偏移,例如GMT+08:00
/UTC+08:00
表示北京东八区,美国纽约西五区就是GMT-05:00
/UTC-05:00
。
其中GMT是格林尼治标准时间(Greenwich Mean Time),GMT时间定义一天就是24小时,一小时60分钟,一分钟60秒,所以一天就是86400秒。但是地球并不是自始至终保持恒定不变的速度自转,而是在缓慢减速的,这样定义会导致一秒钟变得越来越长,所以格林尼治时间不再作为标准时间。而是使用UTC(Coodinated Universal Time, 协调世界时间),UTC使用原子时,一秒定义为,铯-133原子基态的两个超精细能级间在零磁场下辐射跃迁9,192,631,770周所持续的时间。【仿佛回到了大学上半导体物理的时光,时间一去不复返,非常惭愧的是大学学的物理也全都还给老师了】所以使用UTC的一秒就被固定了,就会导致每一年用秒来计算的时间会越来越长,就需要在某些年份进行闰秒(负闰秒,最后一分钟为59秒,正闰秒则是最后一分钟为61秒),规定当时间时和原子时相差超过正负0.9秒时就需要进行闰秒。目前,全球已经进行了27次闰秒,均为正闰秒,最近一次是北京时间2017年1月1日7时59分59秒,时钟显示为07:59:60。
用GMT和UTC来表示时区时可以认为是等价的,UTC每过几年会闰秒,开发程序时可以忽略,计算机的时钟联网时会自动与时间服务器同步。不过貌似有闰秒后电子设备不工作的传闻,不知真假,就是没有考虑到这种情况的原因。
- 另一中时区是使用洲/城市来表示,例如
Asia/Shanghai
,表示上海所在时区,需要注意城市名称不是任意的,而是由国际标准组织规定的城市。
夏令时
夏令时(Daylight Saving Time, DST)的意思是在天亮早的夏季将时间调快一小时,本意是使人早睡早起,减少照明,节约用电。大概的操作夏季开始时讲时间调快一小时,夏季结束时调慢一小时,不同地区夏令时开始和结束时间节点还不一样。
比如前面提到的例子,东八区的12点,如果在今天(5月2日)夏令时期间,由于伦敦和纽约都实行夏令时,伦敦就是凌晨5点,纽约就是夜晚0点。
全世界不同地区可能实行起止时间不同的夏令时,这使得计算就变得繁琐且非常容易出错。理解还是很好理解的,但你如果要我去算那还是饶了我吧。记住一点:计算夏令时应该使用标准库提供的类,而不是自己计算。
本地化
在计算机中,通常使用Locale
表示一个国家或地区的日期、时间、数字、货币等格式。Locale
由语言_国家
的字母缩写构成。例如zh_CN
表示中国,en_US
表示美国,语言用小写,国家用大写。对于日期不同地区表示可能不同,如:
zh_CN: 2020-05-02
en_US: 05/02/2020
计算机用Locale
在日期、时间、货币和字符串之间进行转换。
我们知道不同的时区表示同一个时刻时间表示也不同,但同一个时刻只需要一个整数就可以精确表示,我们称之为Epoch Time,定义为1970年1月1日零点(格林尼治时间/GMT+00:00)到现在所经历的秒数。
根据这个整数给定时区就可以算出当前时区当前时刻的时间表示。Epoch Time也成为了时间戳(Time Stamp),不同编程语言中会有不同的存储方式:
- 以秒为单位的整数,缺点是只能精确到秒。
- 以毫秒为单位的整数,最后三位表示毫秒。
- 秒为单位的浮点数,小数点后表示零点几秒。
他们之间的转换很简单,Java中,时间戳通常是用64位整数long表示的毫秒数。使用System.currentTimeMillis()
获取:
long t = System.currentTimeMillis();
有了这个时刻之后我们自己都可以来算现在的时间了,只要用上小学学到的闰年和大小月,考虑已经进行了的闰秒(时间戳没有累加闰秒,所以不需要考虑),转到东八区,就可以得到一个当前机器的毫秒级精确的北京时间。
public class BeiJingTime {
private int year;
private int month;
private int day;
private int hour;
private int min;
private int sec;
private int milliSec;
public BeiJingTime(int y, int m, int d, int h, int mi, int s, int ms) {
year = y;
month = m;
day = d;
hour = h;
min = mi;
sec = s;
milliSec = ms;
}
@Override
public String toString() {
return year + "-" + month + "-" + day + " " + hour + ":" + min + ":" + sec + "." + milliSec + " UTC+08:00";
}
public static BeiJingTime of(long timeMillis) {
long t = timeMillis;
long milliSec = t % 1000;
t = t / 1000; // do not need to accumulate leap seconds
long day = t / 86400;
long reminder = t % 86400;
long hour = reminder / 3600 + 8; // to UTC+08:00
long min = (reminder % 3600) / 60;
long sec = reminder % 60;
int from = 1970;
int count = 0;
while (day > 0) {
int curYearDay = 365;
if (isLeapYear(from + count)) {
curYearDay = 366;
}
if (day - curYearDay < 0) {
break;
}
day -= curYearDay;
count++;
}
int curYear = from + count;
int curMonth = 1;
while (day > 0) {
int curMonthDay = getMonthDay(curYear, curMonth);
if (day - curMonthDay < 0) {
break;
}
day -= curMonthDay;
curMonth++;
}
day += 1;
return new BeiJingTime(curYear, curMonth, (int)day, (int)hour, (int)min, (int)sec, (int)milliSec);
}
public static Boolean isLeapYear(int year) {
return (year % 4 == 0 && year % 100 != 0) || year % 400 == 0;
}
public static int getMonthDay(int year, int month) {
if (month <= 0 || month > 12) {
throw new IllegalArgumentException("Unexpected month: " + month);
}
int curMonthDay = 30;
switch (month) {
case 1: case 3: case 5: case 7: case 8: case 10: case 12:
curMonthDay = 31;
break;
case 2:
curMonthDay = 28;
if (isLeapYear(year)) {
curMonthDay = 29;
}
break;
}
return curMonthDay;
}
public static void main(String[] args) throws InterruptedException {
while (true) {
Thread.sleep(200);
System.out.println(BeiJingTime.of(System.currentTimeMillis()));
}
}
}
Thread.sleep(200)
就是当前线程睡眠200毫秒,多线程相关内容后续详解。
这里算的就是UTC时间,UTC的话应该要考虑闰秒,但是Epoch Time是不计算闰秒的,所以我们可以直接忽略闰秒的存在,得到的就是当前机器时间戳算出来的标准时间。通过比较和我本地电脑的时间是完全一致的,但不同设备本身保存的这个时间戳由于同步关系可能会有几秒的差距,比如我的手机比电脑就慢2秒左右。但同一个设备不同软件、不同编程语言只要取同一个时间戳计算无误的话那时间肯定应该是完全一致的。
按照平年365天来算,不考虑几年才进行一次的闰秒,一年就是365*86400=31536000秒。一般来说这个系统时间戳使用整数来表示,如果是用32位整数表示的话比如Unix时间戳,因为整数带符号,最大能表示2147483648,也就是68年左右,也就是2038年之后这个时间戳就会溢出变为负数。有人预测2038年之后诸如Linux、IOS等的类Unix系统就会发生时间倒退、不能启动等现象,但现在毕竟还没有到。以后应该会解决这个问题,在现在64位设备已经全面普及的当下,将这个时间戳从底层改为int64_t
之类的64位整数就可以继续用到天荒地老了。Java本身采用64位long表示,无需担心。
考虑夏令时的各个其他国家地区的时间也很简单,只是比较繁琐没有太大的编写意义,用标准库就好。
现在看一下Java标准库中的标准API。Java提供了两套API:
- 旧的一套在
java.util
包中,包括Date
Calendar
TimeZone
。历史遗留原因,旧的API存在很多问题。 - 新的一套是Java8引入的
java.time
包中,LocalDateTime
ZoneDateTime
ZoneId
等。
新的代码当然应该使用新的API,但遇到历史遗留项目中用的旧的API的话也可以在新旧对象之间做转换。
java.util.Date
是用于表示时间和日期的类,注意与java.sql.Date
区分,后者用在数据库中。
Date
中保存了long
类型的毫米时间戳,时间表示都是通过其计算而来。
public class Date
implements java.io.Serializable, Cloneable, Comparable<Date>
{
private transient long fastTime;
public Date(long date) {}
// other constructors...
public static long parse(String s) {} // 从字符串解析时间
public int getYear() {}
public void setYear(int year) {}
// month, day, hour, etc...
public long getTime() {} // 获取到时间戳
public void setTime(long time) {} // 设置时间戳
public boolean before(Date when) {} // 测试当前日期是否早于指定日期
public boolean after(Date when) {} // 测试当前日期是否晚于指定日期
public String toString() {} // dow mon dd hh:mm:ss zzz yyyy格式
public String toLocaleString() {}
public String toGMTString() {}
public int getTimezoneOffset() {}
public static Date from(Instant instant) {}
public Instant toInstant() {}
}
测试:
Date date = new Date();
System.out.println(date); // Mon May 03 16:14:39 CST 2021
System.out.println(date.toLocaleString()); // 2021年5月3日 下午4:14:39
System.out.println(date.toGMTString()); // 3 May 2021 08:14:39 GMT
System.out.println(Date.parse(date.toGMTString())); // 1620029679000 没有毫秒因为GMTString中没有毫秒的信息
System.out.println(date.getTime()); // 时间戳 1620029679673
System.out.println(date.getYear()+1900); // 需要加上1900才是真实年份
System.out.println(date.getMonth()+1); // 结果是0~11需要+1
System.out.println(date.getDate()); // 1~31
System.out.println(date.getDay()); // 1 for Monday
System.out.println(date.toInstant()); // 2021-05-03T08:20:22.197Z
其中getYear
的结果需要+1900,getMonth
结果需要+1,相关set方法同理。
想要针对用户的偏好精确地控制日期和时间的格式,可以使用SimpleDateFormat
类,用预定义的字符串表示格式化。
- yyyy:年
- MM:月
- dd: 日
- HH: 小时
- mm: 分钟
- ss: 秒
SimpleDateFormat sdf = new SimpleDateFormat("yyyy/MM/dd HH:mm:ss");
System.out.println(sdf.format(date));
上面Date
从字符串解析时间只能针对特定的格式,比如toString
或者toGMTString
的结果,而针对本地化格式化的时间则不能解析。但SimpleDateFormat
就可以解析自己定义格式的时间。
public Date parse(String text, ParsePosition pos)
SimpleDateFormat
预定义了很多格式,一般来说字母越长,输出越长,与M
表示月份为例:
M
5MM
05MMM
5月MMMM
五月
Letter | Date or Time Component | Presentation | Examples |
---|---|---|---|
G | Era designator | Text | AD |
y | Year | Year | 1996; 96 |
Y | Week year | Year | 2009; 09 |
M | Month in year (context sensitive) | Month | July; Jul; 07 |
L | Month in year (standalone form) | Month | July; Jul; 07 |
w | Week in year | Number | 27 |
W | Week in month | Number | 2 |
D | Day in year | Number | 189 |
d | Day in month | Number | 10 |
F | Day of week in month | Number | 2 |
E | Day name in week | Text | Tuesday; Tue |
u | Day number of week (1 = Monday, ..., 7 = Sunday) | Number | 1 |
a | Am/pm marker | Text | PM |
H | Hour in day (0-23) | Number | 0 |
k | Hour in day (1-24) | Number | 24 |
K | Hour in am/pm (0-11) | Number | 0 |
h | Hour in am/pm (1-12) | Number | 12 |
m | Minute in hour | Number | 30 |
s | Second in minute | Number | 55 |
S | Millisecond | Number | 978 |
z | Time zone | General time zone | Pacific Standard Time; PST; GMT-08:00 |
Z | Time zone | RFC 822 time zone | -0800 |
X | Time zone | ISO 8601 time zone | -08; -0800; -08:00 |
更多信息详见SimpleDateFormat的JDK文档。
Calendar
可以用于设置年月日时分秒,和Date
相比,多了一个可以做简单的日期和时间运算的功能。
相关接口:
- 获取
Calendar
只有一种方式,使用Calendar.getInstance()
。获取到就是当前时间。如果我们想给它设置成特定的一个日期和时间,就必须先使用clear
清除所有字段。 - 获取信息使用
get(int field)
,返回的年份不需要转换,返回的月份仍需要加1,星期需要特别注意,1~7分别表示周日、周一到周六。 - 利用
Calendar.getTime()
可以将Calendar
转换为Date
对象。
- 包与模块详解
- 日期与时间
- 单元测试
- 正则
- 加密与安全
- 多线程
- Maven
- 网络编程
- XML&JSON
- JDBC
- 函数式
- 设计模式
- Web开发
- Spring
- Spring Boot