1. 二进制
进制就是进位制,常见的有二进制、十进制、十六进制等
在进制中,可用符号的数量称为基数,基数为n就称为n进制,逢n进一位:
二进制:0 1
十进制:0 1 2 3 4 5 6 7 8 9
十六进制:0 1 2 3 4 5 6 7 8 9 A B C D E F
任何一个数都可以使用不同的进制表示,比如十进数9,在二进制中表示为1001,在十六进制中表示为9
计算机内部使用二进制进行运算和存储
二进制只有0和1两个符号,容易用现实中物体的两个稳定状态表示,比如电路中有无电流、晶体管是否导通、磁盘磁体有无磁性等
而且二进制在运算时也较简单
一组重要的数
2的次幂 十进制 二进制
20 1 1
21 2 10
22 4 100
23 8 1000
24 16 1 0000
25 32 10 0000
26 64 100 0000
27 128 1000 0000
28 256 1 0000 0000
29 512 10 0000 0000
210 1024 100 0000 0000
二进制数转为十进制
把二进制数分解成多项,把每项转换为十进制数然后求和
1001(2) --> 1000(2) + 1(2) --> 8(10) + 1(10) -->9(10)
十进制数转二进制
二进制和十六进制相互转换
二进制从0到1111正好是16个数,可以和十六进制的16个符号一一对应
二进制数 十六进制数
0 0
1 1
10 2
11 3
100 4
101 5
110 6
111 7
1000 8
1001 9
1010 A
1011 B
1100 C
1101 D
1110 E
1111 F
二进制 --> 十六进制:从右至左每四位一组(不够四位的在前面补0)
1100100(2) --> 0110 0100(2) --> 6(16) 4(16) --> 64(16)
十六进制 --> 二进制:把每个基数转换为四位二进制数即可
64(16) --> 0110(2) 0100(2) --> 1100100(2)
整数在计算机中的表示
在计算机中,一个0或者1称为一个比特位(bit)
整数有正负,计算机为了可以表示正负整数,把一个二进制数分为两部分:开头1位符号位,后面的是数值位。如果符号位为0则表示正整数,为1则表示负整数。而且计算机在表示负整数时,还需要经过反码、补码的转换
Java中定义了若干基本类型来表示整数,比如byte、short、int、long,由于所占的位数不同,可以表示的整数的范围也不同
byte(字节) 8bit(1个符号位和7个数值位) [-27 , 27-1]、[-128 , 127]
short 16bit(1个符号位和15个数值位) [-215 , 215-1]、[-32768 , 32767]
int 32bit(1个符号位和31个数值位) [-231 , 231-1] 、最大值21亿多一些
long 64bit(1个符号位和63个数值位) [-263 , 263-1]
2. 字符编码
我们在屏幕上看到的文字,在计算机内部其实是一串二进制的数据。
每个字符都有一个编码,比如'A'的编码为65,在内存、文件中存储的就是这些编码的二进制形式(比如0100 0001),当文本处理程序遇到65时,就会在屏幕上显示A
ASCII字符集
最基本的字符编码表(字符集)是ASCII,规定了128个字符(编码从0到127),包括基本的英文标点符号、阿拉伯数字、英文大小写字母、还有一些不能显示的控制字符
在计算机中1byte(8位)可表示的整数范围是[-128 , 127] ,可以容纳所有的ASCII字符,所以就使用1byte的存储空间来存储、表示一个ASCII字符,而且ASCII字符编码都是正整数
需要记住的字符的编码
'A' -- 65
'a' -- 97
其他字符集
其他字符集都基于、兼容ASCII,常见的有GB2312、BIG5、GBK、Unicode、UTF-8等
GB2312是简体中文字符集,主要包含六千多个常用的汉字。在GB2312中,ASCII字符还是使用一个字节存储,其他汉字使用两个字节存储,并且这两个字节的符号位都是1(为了避免和ASCII字符混淆),比如 '中' 这个字符的编码是 -42, -48
Big5是繁体中文字符集,主要包括一万多个繁体汉字,港澳台地区用的较多
GBK是GB2312的扩展,主要包含两万多个汉字,涵盖了大部分简、繁汉字
Unicode是全世界统一的字符集,包含了世界各地的语言文字。Unicode经过了很长时间的发展,有多个版本,本身很庞大也很复杂。在程序中直接使用Unicode会降低程序的执行效率,也很占用较多的存储空间和网络带宽,所以Unicode只用来给文字编码,实际使用时,一般使用UTF-8,它可以把Unicode字符转换为尽可能简短的形式。
UTF-8会使用尽可能少的字节数来表示Unicode字符,以便提高程序处理效率等。在UTF-8中,有的字符使用一个字节存储,有的使用两个、三个或者四个字节,比如 '中' 在UTF-8中的编码是 -28, -72, -83
3. JVM内存结构
JVM在运行时把从操作系统申请到的内存分为若干区域,主要有栈、堆和方法区,方便Java程序使用
堆内存
使用new关键字创建出来的对象都存储在堆内存中
方法区
被加载的类的信息存储在方法区中,包括类声明、字段、方法等信息
栈内存
其实Java程序中的每个线程都有自己的栈内存
栈内存用来存储方法执行时创建的局部变量
方法每执行一次,就会在栈内存中开辟一块内存空间,称为栈帧,方法执行结束后,这个栈帧随即被销毁回收
public class Test1 { public static void main(String[] args) { int age1 = 16; Dog dog1 = new Dog(); User user1 = new User(); user1.setAge(age1); user1.setDog(dog1); } } class Dog { } class User { private int age; private Dog dog; public int getAge() { return age; } public void setAge(int age) { this.age = age; } public Dog getDog() { return dog; } public void setDog(Dog dog) { this.dog = dog; } }
4. 常量池
用来把一些常用对象缓存起来,以便重复使用。包括[-128,127]范围内的整形基本类型包装类的对象(如Byte、Short、Integer等),和以 "xx" 形式出现的String对象(称为字面量)
JVM在启动时就会创建这些整形对象并保存在常量池中,在加载类时会把类中的String字面量保存在常量池中
5. 垃圾回收
当存储在堆内存中的对象不能再被程序使用时(比如已经没有变量指向这个对象),在某个时刻就会被垃圾回收器回收。
JVM会使用一个单独的线程不定时的执行垃圾回收,垃圾回收器一般从若干个根对象开始遍历并标记遍历到的对象,那些最终也没被标记的对象就会被垃圾回收器回收
开发人员也可以使用System.gc();方法“催促”垃圾回收器进行回收,但不能保证立即回收
6. 类加载
当Java程序中需要用到一个类时,JVM的类加载器就会找到这个类并把该类加载到内存中,整个加载过程分为多个阶段,其中三个阶段如下:
加载阶段
根据全限定类名找到类的.class文件并加载到方法区内存中,同时在堆内存中生成一个java.lang.Class对象来表示这个类
准备阶段
在方法区内为静态变量分配内存,这个时候静态变量的值是其类型的初始值,比如int类型的初始值为0
初始化阶段
按出现顺序把静态变量赋值语句和静态代码块合并成<clinit>()方法,然后执行此方法,以便给静态变量赋值和执行静态代码块。另外,如果一个类有父类,则父类的初始化阶段先执行
另外,使用new调用构造函数创建对象时,会按出现顺序把类的非静态字段赋值语句、非静态代码块,连同放在最后被调用的构造函数一起合并成<init>()方法,执行此方法完成对象的创建
public class Test4 { public static int n = 16; static { System.out.println(n); } public static Object obj = new Object(); static { System.out.println(obj); } public static void main(String[] args) { System.out.println("main"); } }
Person p = new Person(); 这句代码执行的时候,以下模块的执行顺序是如下:123456 (1)父类静态代码块 (2)子类静态代码块 (3)父类非静态代码块 (4)父类构造函数 (5)子类非静态代码块 (6)子类构造函数
7. 递归方法
方法自己调用自己就称为递归。递归方法应该有两个要素:递推规则和返回条件
递推规则指方法如何自己调用自己
返回条件指方法什么时候不再调用自己,从而让方法可以返回,不至于一直递归下去导致栈内存溢出
public class Digui { //讲故事(没有返回条件,最终会栈内存溢出) public static void story() { System.out.println("从前有个庙,庙里的老和尚在给小和尚讲故事,讲的故事是:"); story(); } //自然数n的阶乘 n! = n*(n-1)*...*3*2*1,其中0!=1;也可以表示为 n! = n*(n-1)!,0!=1 public static int jiecheng(int n) { if (n > 0) { //递推规则 n! = n*(n-1)! return n * jiecheng(n - 1); } else { //返回条件0!=1 return 1; } } }
8. 访问类路径下的资源
类路径即classpath,JVM加载类时会到类路径下寻找并加载类的.class文件。类路径默认有JDK的lib目录,项目的bin目录
项目编译时会把src目录下的.java文件编译成.class文件,并把.class文件放在项目的bin目录下;src下的其他文件则直接被copy到bin目录下,所以访问类路径下的资源可以看成访问src目录下的非.java文件
可以使用ClassLoader对象的getResource或者getResourceAsStream方法访问类路径下的资源。注意ClassLoader以bin(src)目录为根目录,资源以相对路径的形式指定
URL url = Demo.class.getClassLoader().getResource("text1.txt"); String path = url.getFile(); InputStream input = Demo.class.getClassLoader().getResourceAsStream("text1.txt");
另外使用Class对象也可以访问类路径下的资源,但资源需要以绝对路径的形式给出
URL url = Demo.class.getResource("/text1.txt"); String path = url.getFile(); InputStream input = Demo.class.getResourceAsStream("/text1.txt");
注意:需要使用项目自己的类来获得ClassLoader或者Class对象