深入理解Java虚拟机--类文件结构

简介: 本内容介绍了Java虚拟机与Class文件的关系及其内部结构。Class文件是一种与语言无关的二进制格式,包含JVM指令集、符号表等信息。无论使用何种语言,只要能生成符合规范的Class文件,即可在JVM上运行。文章详细解析了Class文件的组成,包括魔数、版本号、常量池、访问标志、类索引、字段表、方法表和属性表等,并说明其在Java编译与运行过程中的作用。

Java虚拟机不和包括Java在内的任何语言绑定,它只与“Class文件”这种特定的二进制文件格式所关联,Class文件中包含了Java虚拟机指令集和符号表以及若干其他辅助信息。任一门功能性语言都可以表示为一个能被Java虚拟机所接受的有效的Class文件,所以虚拟机并不关系Class的来源是何种语言

2.Class类文件的结构

任何一个Class文件都对应着唯一一个类或接口的定义信息,但反过来说,类或接口并不一定得定义在文件里(譬如类或接口也可可以通过类加载器直接生成)。

  • Class文件说一组以8位字节为基础单位的二进制流,各个数据项目严格的按照顺序紧凑地排列在Class文件中,中间没有任何分隔符,所以Class文件中存储的内容几乎都是程序运行的必要数据,没有空隙存在
  • 当遇到需要占用8位字节以上空间的数据项时,则会按照高位在前的放松分割成若干个8位字节进行存储
  • Class文件格式采用一种类似于V语言结构体的伪结构体存储数据,伪结构中只有两周数据类型:无符号数、表
  • 无符号数属于基本数据类型,以u1、u2、u4、u8来分别代表1个字节、2个字节、4个字节、8个字节的无符号数,无符号数可以用来描述数字,索引引用、数量值、按照UTF-8bianma构成字符串值
  • 表说由多个无符号数,或其他表作为数据项构成的复合数据类型,所有表都习惯性地以“  _info”结尾
  • 整个Class文件本质上将是一张表
  • 由于Class文件没有设置任何间隔,所以一切数据项都有严格的规定 ##2.1 魔数与Class文件的版本
  • Class文件前4个字节为魔数,唯一的作用的是确定这个文件能被虚拟机接受。魔数固定值为0xCAFEBABE为咖啡的寓意
  • 魔数后的4个字节,分别为此版本号与主版本号,版本号必须是虚拟机可执行版本内,该Class文件才可被虚拟机执行

2.2常量池

主版本号之后啥常量池入口,常量池可以理解为Class文件之中的资源仓库,它是Class文件结构中与其他项目关联最多的数据类型,也是占用Class文件空间最大的数据项目之一,同时它还是Class文件中第一个出现的表类型数据项目

  • 常量池的常量数量不固定,所以常量池需要放置一个u2类型的数据,代表常量池容量计数值(从1开始,如果是22,则代表有21项常量) 常量池主要存放两大类常量:
  • 字面量:比较接近于java语言层面的常量概念,如文本字符串、声明为final的常量值等
  • 符号引用:属于编译器原理方面的概念,包括三类常量:类和接口的全限定名、字段的名称和描述符、方法的名称和描述符 Java代码在进行Javac编译的时候,不像C和C++那样有“连接”这一步骤,而是在虚拟机加载Class文件的时候进行动态链接。也就算说Class文件中不会保存各个方法、字段的最终内存布局,因此这些字段、方法的符号引用不用经过运行期转换的话无法得到真正的内存地址,也就无法直接被虚拟机使用。当虚拟机运行时,,需要从常量池获得对应的符号引用,再在类创建时或运行时解析、翻译到具体的内存地址之中。

2.3访问标志

常量池之后,紧接着的两个字节代表访问标志,这个标志用于一些类或者接口层次的访问信息,包括:这个Class是类还是接口;是否定义为public类型;是否定义abstract类型;如果是类的话,是否被声明为final等。

2.4类索引、父类索引、与接口索引集合

类索引、父类索引都是一个u2类型的数据,而接口索引集合是一组u2类型的数据的集合,Class文件中由这三项数据来确定这个类的继承关系。类索引用于确定这个类全限定名,父类索引用于确定这个类的父类的全限定名。由于所有Java类最多只有一个父类,所以父类索引只有一个。接口索引集,描述这个类实现了哪些接口,这些被实现的接口将按implements语句后的接口顺序从左到右排序在接口索引集合中。

2.5字段表集合

(filed_info)字段表描述接口或者类中声明的变量。

  • 字段(field)包括类级变量以及实例级变量,但不包括方法内部声明的局部变量。
  • 描述的内容可以包括字段的作用域(public、private..)、是实例变量还是类变量(static修饰符)、可变形(final)等等

2.6方法表集合

  • Class文件存储格式中对方法对描述与对字段的描述一致
  • 方法里的Java代码,经过编译器编译成字节码指令后,存放在方法熟悉表集合中一个名为“Code”的属性里面。

2.6属性表集合

在Class文件、字段表、方法表都可以携带自己的属性表集合,以描述某些场景专有的信息


转载来源:https://juejin.cn/post/7001658503538409503

相关文章
|
6月前
|
Arthas 存储 算法
深入理解JVM,包含字节码文件,内存结构,垃圾回收,类的声明周期,类加载器
JVM全称是Java Virtual Machine-Java虚拟机JVM作用:本质上是一个运行在计算机上的程序,职责是运行Java字节码文件,编译为机器码交由计算机运行类的生命周期概述:类的生命周期描述了一个类加载,使用,卸载的整个过类的生命周期阶段:类的声明周期主要分为五个阶段:加载->连接->初始化->使用->卸载,其中连接中分为三个小阶段验证->准备->解析类加载器的定义:JVM提供类加载器给Java程序去获取类和接口字节码数据类加载器的作用:类加载器接受字节码文件。
601 55
|
1月前
|
Java Unix Go
【Java】(8)Stream流、文件File相关操作,IO的含义与运用
Java 为 I/O 提供了强大的而灵活的支持,使其更广泛地应用到文件传输和网络编程中。!但本节讲述最基本的和流与 I/O 相关的功能。我们将通过一个个例子来学习这些功能。
151 1
|
4月前
|
监控 Java API
Java语言按文件创建日期排序及获取最新文件的技术
这段代码实现了文件创建时间的读取、文件列表的获取与排序以及获取最新文件的需求。它具备良好的效率和可读性,对于绝大多数处理文件属性相关的需求来说足够健壮。在实际应用中,根据具体情况,可能还需要进一步处理如访问权限不足、文件系统不支持某些属性等边界情况。
249 14
|
4月前
|
存储 人工智能 Java
java之通过Http下载文件
本文介绍了使用Java实现通过文件链接下载文件到本地的方法,主要涉及URL、HttpURLConnection及输入输出流的操作。
286 0
|
5月前
|
存储 Java 数据安全/隐私保护
Java技术栈揭秘:Base64加密和解密文件的实战案例
以上就是我们今天关于Java实现Base64编码和解码的实战案例介绍。希望能对你有所帮助。还有更多知识等待你去探索和学习,让我们一同努力,继续前行!
455 5
|
5月前
|
网络协议 安全 Java
实现Java语言的文件断点续传功能的技术方案。
像这样,我们就完成了一项看似高科技、实则亲民的小工程。这样的技术实现不仅具备实用性,也能在面对网络不稳定的挑战时,稳稳地、不失乐趣地完成工作。
321 0
|
7月前
|
Arthas 监控 Java
Arthas sc(查看JVM已加载的类信息 )
Arthas sc(查看JVM已加载的类信息 )
388 9
|
28天前
|
存储 缓存 Java
我们来说一说 JVM 的内存模型
我是小假 期待与你的下一次相遇 ~
185 4
|
1月前
|
存储 缓存 算法
深入理解JVM《JVM内存区域详解 - 世界的基石》
Java代码从编译到执行需经javac编译为.class字节码,再由JVM加载运行。JVM内存分为线程私有(程序计数器、虚拟机栈、本地方法栈)和线程共享(堆、方法区)区域,其中堆是GC主战场,方法区在JDK 8+演变为使用本地内存的元空间,直接内存则用于提升NIO性能,但可能引发OOM。
|
7月前
|
Arthas 监控 Java
Arthas memory(查看 JVM 内存信息)
Arthas memory(查看 JVM 内存信息)
588 6
下一篇