ART深度探索开篇:从Method Hook谈起

cawy9281 7年前
   <p>Android上的热修复框架 AndFix 想必已经是耳熟能详,它的原理实际上很简单:方法替换——Java层的每一个方法在虚拟机实现里面都对应着一个ArtMethod的结构体,只要把原方法的结构体内容替换成新的结构体的内容,在调用原方法的时候,真正执行的指令会是新方法的指令;这样就能实现热修复。</p>    <p>为什么可以这么做呢?那得从 Android 虚拟机的方法调用过程说起。作为一个系列的开篇,本文不打算展开讲虚拟机原理等内容,首先给大家一道开胃菜;后续我们再深入探索ART。</p>    <p>众所周知,AndFix是一种 native 的hotfix方案,它的替换过程是用 c 在 native层完成的,但其实,我们也可以用纯Java实现它!而且,代码还非常精简,且看——</p>    <p><strong>方法替换原理</strong></p>    <p>既然我们知道 AndFix 的原理是方法替换,那么为什么直接替换Java里面的 `java.lang.reflect.Method` 有什么问题吗?直接这样貌似很难下结论,那我们换个思路。我们实现方法替换的结果,就是调用原方法的时候最终是调用被替换的方法。因此,我们可以看看 `java.lang.reflect.Method`类的 `invoke` 方法。(这里有个疑问,Foo.bar()这种直接调用与反射调用Foo.class.getDeclaredMethod("bar").invoke(null) 有什么区别吗?这个问题后续再谈)</p>    <pre>  <code class="language-java">private native Object invoke(Object receiver, Object[] args, boolean accessible)              throws IllegalAccessException, IllegalArgumentException, InvocationTargetException;</code></pre>    <p>这个invoke是一个native方法,它的native实现在 `art/runtime/native/ <a href="/misc/goto?guid=4959741765197572628" rel="nofollow,noindex"> http:// java_lang_reflect_Method.cc </a> ` 里面,这个jni方法最终调用了 `art/runtime/ <a href="/misc/goto?guid=4959741765320865014" rel="nofollow,noindex"> http:// reflection.cc </a> ` 的 `InvokeMethod`方法:</p>    <pre>  <code class="language-java">object InvokeMethod(const ScopedObjectAccessAlreadyRunnable& soa, jobject javaMethod,                       jobject javaReceiver, jobject javaArgs, bool accessible) {    // 略...      mirror::ArtMethod* m = mirror::ArtMethod::FromReflectedMethod(soa, javaMethod);      mirror::Class* declaring_class = m->GetDeclaringClass();      // 按需初始化类,略。。      mirror::Object* receiver = nullptr;    if (!m->IsStatic()) {      // Check that the receiver is non-null and an instance of the field's declaring class.      receiver = soa.Decode<mirror::Object*>(javaReceiver);      if (!VerifyObjectIsClass(receiver, declaring_class)) {        return NULL;      }        // Find the actual implementation of the virtual method.      m = receiver->GetClass()->FindVirtualMethodForVirtualOrInterface(m);    }      // 略..    InvokeWithArgArray(soa, m, &arg_array, &result, shorty);    // 略 。。    // Box if necessary and return.    return soa.AddLocalReference<jobject>(BoxPrimitive(mh.GetReturnType()->GetPrimitiveType(),                                                       result));  }</code></pre>    <p>上面函数 InvokeMethod 的第二个参数 `javaMethod` 就是Java层我们进行反射调用的那个Method对象,在jni层反映为一个jobject;InvokeMethod这个native方法首先通过 `mirror::ArtMethod::FromReflectedMethod` 获取了Java对象的在native层的 ArtMethod指针,我们跟进去看看是怎么实现的:</p>    <pre>  <code class="language-java">ArtMethod* ArtMethod::FromReflectedMethod(const ScopedObjectAccessAlreadyRunnable& soa,                                            jobject jlr_method) {    mirror::ArtField* f =        soa.DecodeField(WellKnownClasses::java_lang_reflect_AbstractMethod_artMethod);    mirror::ArtMethod* method = f->GetObject(soa.Decode<mirror::Object*>(jlr_method))->AsArtMethod();    DCHECK(method != nullptr);    return method;  }</code></pre>    <p>我们在这里看到了一点端倪,获取到了Java层那个Method对象的一个叫做 `artMethod`的字段,然后强转成了ArtMethod指针(这里的说法不是很准确,但是要搞明白这里面的细节一两篇文章讲不清楚 ~_~,我们暂且这么认为吧。)</p>    <p>AndFix的实现里面,也正是使用这个 `FromReflectedMethod` 方法拿到Java层Method对应native层的ArtMethod指针,然后执行逐个字段替换的。</p>    <p>上面我们也看到了,我们在native层替换的那个 ArtMethod 不是在 Java 层也有对应的对象么?我们直接替换掉 Java 层的这个artMethod 字段不就OK了?但是我们要注意的是,在Java里面除了基本类型,其他东西都是引用。要实现类似C++里面那种替换 <strong>引用所代表的内容</strong> 的机智,需要一些黑科技。</p>    <p><strong>Unsafe 和 Memory</strong></p>    <p>要在Java层操作内存,也不是没有办法做到;JDK给我们留了一个后门:`sun.misc.Unsafe` 类;在OpenJDK里面这个类灰常强大,从内存操作到CAS到锁机制,无所不能(可惜的是据说JDK8要去掉?)但是在Android 平台还有一点点不一样,在 Android N之前,Android的JDK实现是 Apache Harmony,这个实现里面的Unsafe就有点鸡肋了,没法写内存;好在Android 又开了一个后门:`Memory` 类。</p>    <p>有了这两个类,我们就能在Java层进行简单的内存操作了!!由于这两个类是隐藏类,我写了一个wrapper,如下:</p>    <pre>  <code class="language-java">private static class Memory {            // libcode.io.Memory#peekByte          static byte peekByte(long address) {              return (Byte) Reflection.call(null, "libcore.io.Memory", "peekByte", null, new Class[]{long.class}, new Object[]{address});          }            static void pokeByte(long address, byte value) {              Reflection.call(null, "libcore.io.Memory", "pokeByte", null, new Class[]{long.class, byte.class}, new Object[]{address, value});          }            public static void memcpy(long dst, long src, long length) {              for (long i = 0; i < length; i++) {                  pokeByte(dst, peekByte(src));                  dst++;                  src++;              }          }      }        static class Unsafe {            static final String UNSAFE_CLASS = "sun.misc.Unsafe";          static Object THE_UNSAFE;            private static boolean is64Bit;            static {              THE_UNSAFE = Reflection.get(null, UNSAFE_CLASS, "THE_ONE", null);              Object runtime = Reflection.call(null, "dalvik.system.VMRuntime", "getRuntime", null, null, null);              is64Bit = (Boolean) Reflection.call(null, "dalvik.system.VMRuntime", "is64Bit", runtime, null, null);          }            public static long getObjectAddress(Object o) {              Object[] objects = {o};              Integer baseOffset = (Integer) Reflection.call(null, UNSAFE_CLASS,                      "arrayBaseOffset", THE_UNSAFE, new Class[]{Class.class}, new Object[]{Object[].class});              return ((Number) Reflection.call(null, UNSAFE_CLASS, is64Bit ? "getLong" : "getInt", THE_UNSAFE,                      new Class[]{Object.class, long.class}, new Object[]{objects, baseOffset.longValue()})).longValue();          }      }</code></pre>    <p><strong>具体实现</strong></p>    <p>接下来思路就很简单了呀,用伪代码表示就是:</p>    <p>memcopy(originArtMethod, replaceArtMethod);</p>    <p>但是还有一个问题,我们要整个把 originMethod 的 artMethod 所在的内存直接替换为 replaceMethod 的artMethod 所在的内存(上面我们已经知道,Java层Method类的artMethod实际上就是native层的指针表示,在Android N上更明显,这玩意儿直接就是一个long),现在我们已经知道这两个地址是什么,那么我们把 replaceArtMethod 代表的内存复制到 originArtMethod 的区域,应该还需要知道一个 artMethod 有多大。</p>    <p>但是事情没有一个 sizeof 那么简单。你看AndFix的实现是在每个Android版本把ArtMethod这个结构体复制一份的;要想用sizeof还得把这个类所有的引用复制过来,及其麻烦。更何况在Java里面 sizeof都没有。不过也不是没有办法,既然我们已经能在Java层拿到对象的地址,只需要创建一个数组,丢两个ArtMethod,把两个数组元素的起始地址相减不就得到一个 artMethod的大小了吗?</p>    <p>不过,既然我们实现了方法替换;还有最后一个问题,如果我们需要在替换后的方法里面调用原函数呢?这个也很简单,我们只需要把原函数copy一份保存起来,需要调用原函数的时候调用那个copy的函数不就行了?不过在具体实现的时候,会遇到一个问题,就是 Java的非static 非private的方法默认是虚方法,在调用这个方法的时候会有一个类似查找虚函数表的过程,这个在上面的代码 `InvokeMethod` 里面可以看到:</p>    <pre>  <code class="language-java">mirror::Object* receiver = nullptr;    if (!m->IsStatic()) {      // Check that the receiver is non-null and an instance of the field's declaring class.      receiver = soa.Decode<mirror::Object*>(javaReceiver);      if (!VerifyObjectIsClass(receiver, declaring_class)) {        return NULL;      }        // Find the actual implementation of the virtual method.      m = receiver->GetClass()->FindVirtualMethodForVirtualOrInterface(m);    }</code></pre>    <p>在调用的时候,如果不是static的方法,会去查找这个方法的真正实现;我们直接把原方法做了备份之后,去调用备份的那个方法,如果此方法是public的,则会查找到原来的那个函数,于是就无限循环了;我们只需要阻止这个过程,查看 FindVirtualMethodForVirtualOrInterface 这个方法的实现就知道,只要方法是 invoke-direct 进行调用的,就会直接返回原方法,这些方法包括:构造函数,private的方法因此,我们手动把这个备份的方法属性修改为private即可解决这个问题。</p>    <p>至此,我们就用纯Java实现了一个 AndFix,代码只有200行不到!!是不是很神奇?当然,这里面包含了很多黑科技,接下来我们将以这个为引子,深入探索Android ART的方方面面,揭开虚拟机底层的神秘面纱,敬请期待~~</p>    <p> </p>    <p>来自:https://zhuanlan.zhihu.com/p/25794073</p>    <p> </p>