Java反射在JVM中的实现-蒲公英云

什么是反射？

反射使程序代码能够接入装载到JVM中的类的内部信息，允许在编写与执行时，而不是源代码中选定的类协作的代码，是以开发效率换运行效率的一种手段。这使反射成为构建灵活应用的主要工具。

反射的作用

反射可以：

实现跨平台兼容，比如JDK中的SocketImpl的实现
通过xml或注解，实现依赖注入(DI)，注解处理，动态代理，单元测试等功能。比如Retrofit、Spring或者Dagger

Java Class文件结构介绍

在*.class文件中，以Byte流的形式进行Class的存储，通过一系列Load，Parse后，Java代码实际上可以映射为下图的结构体，这里可以用javap命令或者IDE插件进行查看。

typedef struct {
 u4 magic;/*0xCAFEBABE*/
 u2 minor_version; /*网上有表可查*/
 u2 major_version; /*网上有表可查*/
 u2 constant_pool_count;
 cp_info constant_pool[constant_pool_count-1];
 u2 access_flags;
 u2 this_class;
 u2 super_class;
 u2 interfaces_count;
 u2 interfaces[interfaces_count];
 //重要
 u2 fields_count;
 field_info fields[fields_count];
 //重要
 u2 methods_count;
 method_info methods[methods_count];
 u2 attributes_count;
 attribute_info attributes[attributes_count];
}ClassBlock;

常量池(constant pool):类似于C中的DATA段与BSS段，提供常量、字符串、方法名等值或者符号（可以看作偏移定值的指针）的存放
access_flags: 对Class的flag修饰

def enum {
 ACC_PUBLIC = 0x0001,
 ACC_FINAL = 0x0010,
 ACC_SUPER = 0x0020,
 ACC_INTERFACE = 0x0200,
 ACC_ACSTRACT = 0x0400
 }AccessFlag

this class/super class/interface: 一个长度为u2的指针，指向常量池中真正的地址，将在Link阶段进行符号解引。

filed: 字段信息，结构体如下

typedef struct fieldblock {
     char *name;
     char *type;
     char *signature;
     u2 access_flags;
     u2 constant;
     union {
         union {
             char data[8];
             uintptr_t u;
             long long l;
             void *p;
             int i;
         } static_value; 
         u4 offset;
     } u;
  } FieldBlock;

method: 提供descriptor, access_flags, Code等索引，并指向常量池：
它的结构体如下，详细在这里

method_info {
     u2             access_flags;
     u2             name_index;
     //the parameters that the method takes and the 
     //value that it return
     u2             descriptor_index;
     u2             attributes_count;
     attribute_info attributes[attributes_count];
 }

Java Class文件加载过程

Classloader加载过程

ClassLoader用于加载、连接、缓存Class，可以通过纯Java或者native进行实现。在JVM的native代码中，ClassLoader内部维护着一个线程安全的HashTable String,Class>，用于实现对Class字节流解码后的缓存，如果HashTable中已经有了缓存，则直接返回缓存；反之，在获得类名后，通过读取文件、网络上的class字节流反序列化为JVM中native的C结构体，接着malloc内存，并将指针缓存在HashTable中。

下面是非数组情况下ClassLoader的流程

find/load: 将文件反序列化为C结构体。

link: 根据Class结构体常量池进行符号的解引。比如对象计算内存空间，创建方法表，native invoker，接口方法表，finalizer函数等工作。

初始化过程

当ClassLoader加载Class结束后，将进行Class的初始化操作。主要执行clinit()>的静态代码段与静态变量（取决于源码顺序）。

public class Sample {
  //step.1
  static int b = 2;
  //step.2
  static {
    b = 3;
  }
  public static void main(String[] args) {
    Sample s = new Sample();
    System.out.println(s.b);
    //b=3
  }
}

反射在native中的应用

反射在Java中可以直接调用，不过最终调用的仍是native方法，以下为主流反射操作的实现。

Class.forName的实现

Class.forName可以通过包名寻找Class对象，比如Class.forName(“java.lang.String”)。
在JDK的源码实现中，可以发现最终调用的是native方法forName0()，它在JVM中调用的实际是findClassFromClassLoader()，原理与ClassLoader的流程一样，具体实现已经在上面介绍过了。