返回

使用 GDB 调试原生可执行文件

使用哪个 GDB?

  • 请使用 GDB 14.2 或更高版本。调试信息已通过 mx debuginfotest 对 14.2 进行了测试。
  • 请注意,更高版本可能对调试器输出的格式略有不同(例如,这可能导致 CI/CD 门禁检查失败)。
  • 最近 Linux 版本中捆绑的 GDB 完全适用于调试会话。

构建带有调试信息的本地可执行文件

要构建带有调试信息的本地可执行文件,请在编译应用程序时为 javac 提供 -g 命令行选项,然后将其提供给 native-image 构建器。这可以启用源级调试,调试器 (GDB) 随后会将机器指令与 Java 文件中的特定源代码行关联起来。

-g 添加到 native-image 参数会导致生成调试信息。在本地可执行文件旁边,会有一个包含调试信息的 <executable_name>.debug 文件和一个包含 Java 源文件的 sources/ 目录,调试器会使用这些文件来显示行信息的源。例如

hello_image
hello_image.debug
sources

GDB 会自动为给定的本地可执行文件 <executable_name> 加载 <executable_name>.debug 文件。(本地可执行文件与其 *.debug 文件之间存在链接。)

为了获得更好的调试体验,我们建议将 -g-O0 结合使用。后者选项会禁用 Graal 编译器的内联和其他优化,否则这些优化会在调试器中可见(例如,调试器可能会在行之间来回跳转,而不是允许您从一行单步执行到下一行)。同时,-O0 还会启用在编译器中收集额外的元数据,这有助于调试器解析(例如)局部变量。

将 GDB 与新调试信息一起使用

构建信息

*.debug 文件包含有关构建的额外信息,可以按如下方式访问

readelf -p .debug.svm.imagebuild.classpath hello_image.debug

它列出了用于构建本地可执行文件的所有类路径条目。

String dump of section '.debug.svm.imagebuild.classpath':
  [     0]  /home/user/.mx/cache/HAMCREST_e237ae735aac4fa5a7253ec693191f42ef7ddce384c11d29fbf605981c0be077d086757409acad53cb5b9e53d86a07cc428d459ff0f5b00d32a8cbbca390be49/hamcrest.jar
  [    b0]  /home/user/.mx/cache/JUNIT_5974670c3d178a12da5929ba5dd9b4f5ff461bdc1b92618c2c36d53e88650df7adbf3c1684017bb082b477cb8f40f15dcf7526f06f06183f93118ba9ebeaccce/junit.jar
  [   15a]  /home/user/mx/mxbuild/jdk20/dists/jdk9/junit-tool.jar
  [   1a9]  /home/user/graal/substratevm/mxbuild/jdk20/com.oracle.svm.test/bin

以下部分可用

  • .debug.svm.imagebuild.classpath
  • .debug.svm.imagebuild.modulepath
  • .debug.svm.imagebuild.arguments
  • .debug.svm.imagebuild.java.properties

main() 方法在哪里?

使用

info functions ::main

查找所有名为 main 的方法,然后使用 b <main method name>,例如

(gdb) info functions ::main
All functions matching regular expression "::main":

File hello/Hello.java:
76:	void hello.Hello::main(java.lang.String[]*);

File java/util/Timer.java:
534:	void java.util.TimerThread::mainLoop();
(gdb) b 'hello.Hello::main'

Breakpoint 1 at 0x83c030: file hello/Hello.java, line 76.

设置断点

首先,找到要设置断点的方法类型,例如

(gdb) info types ArrayList
All types matching regular expression "ArrayList":

...
File java/util/ArrayList.java:
	java.util.ArrayList;
	java.util.ArrayList$ArrayListSpliterator;
	java.util.ArrayList$Itr;
	java.util.ArrayList$ListItr;
...

现在使用以下 GDB 自动补全

(gdb) b 'java.util.ArrayList::

现在按两次 Tab 键会显示所有 ArrayList 方法供选择。

java.util.ArrayList::ArrayList(int)                                                java.util.ArrayList::iterator()
java.util.ArrayList::ArrayList(java.util.Collection*)                              java.util.ArrayList::lastIndexOf(java.lang.Object*)
java.util.ArrayList::add(int, java.lang.Object*)                                   java.util.ArrayList::lastIndexOfRange(java.lang.Object*, int, int)
java.util.ArrayList::add(java.lang.Object*)                                        java.util.ArrayList::listIterator()
java.util.ArrayList::add(java.lang.Object*, java.lang.Object[]*, int)              java.util.ArrayList::listIterator(int)
java.util.ArrayList::addAll(int, java.util.Collection*)                            java.util.ArrayList::nBits(int)
java.util.ArrayList::addAll(java.util.Collection*)                                 java.util.ArrayList::outOfBoundsMsg(int)
...

如果用以下内容完成

(gdb) b 'java.util.ArrayList::add`

则安装所有 add 变体中的断点。

数组

数组有一个 data 字段,可以通过索引访问以获取单个数组元素,例如

Thread 1 "hello_image" hit Breakpoint 1, hello.Hello::main(java.lang.String[]*) (args=0x7ff33f800898) at hello/Hello.java:76
76	        Greeter greeter = Greeter.greeter(args);
(gdb) p args
$1 = (java.lang.String[] *) 0x7ff33f800898
(gdb) p *args
$2 = {
  <java.lang.Object> = {
    <_objhdr> = {
      hub = 0x1e37be0
    }, <No data fields>}, 
  members of java.lang.String[]:
  len = 4,
  data = 0x7ff33f8008a0
}
(gdb) p args.data
$3 = 0x7ff33f8008a0
(gdb) ptype args.data
type = class _z_.java.lang.String : public java.lang.String {
} *[0]

此处 args.data 可以通过索引访问。

在此示例中,四个数组元素中的第一个是指向 String 的指针。

(gdb) p args.data[0]
$4 = (_z_.java.lang.String *) 0x27011a

字符串

要查看 Java String 对象的实际内容,请查看其 value 字段,例如

(gdb) p args.data[0]
$4 = (_z_.java.lang.String *) 0x27011a

args.data[0] 指向一个 String 对象。我们来解引用。

(gdb) p *args.data[0]
$5 = {
  <java.lang.String> = {
    <java.lang.Object> = {
      <_objhdr> = {
        hub = 0x1bb4780
      }, <No data fields>}, 
    members of java.lang.String:
    value = 0x270118,
    hash = 0,
    coder = 0 '\000',
    hashIsZero = false,
    static CASE_INSENSITIVE_ORDER = 0x19d752,
    ...
    static COMPACT_STRINGS = true
  }, <No data fields>}

value 字段保存 String 数据。我们来检查 value 的类型。

(gdb) p args.data[0].value
$3 = (_z_.byte[] *) 0x250119

value 的类型是 byte[]

如您之前所学,数组的元素可以通过其 data 字段访问。

(gdb) p args.data[0].value.data
$10 = 0x7ff33f8008c8 "this\376\376\376\376\200G\273\001\030\001'"

GDB 足够智能,可以开箱即用地将字节指针解释为 C 字符串。但本质上,它是一个数组。以下内容为我们提供了 this 中的 t

(gdb) p args.data[0].value.data[0]
$13 = 116 't'

最后一个字符后面的垃圾数据的原因是 Java String 值不是以 0 终止的(与 C 字符串不同)。要了解垃圾数据从何处开始,可以检查 len 字段。

(gdb) p args.data[0].value.len
$14 = 4

向下转型

假设您的源代码使用静态类型为 Greeter 的变量,并且您想要检查其数据。

75	    public static void main(String[] args) {
76	        Greeter greeter = Greeter.greeter(args);
77	        greeter.greet(); // Here you might have a NamedGreeter

如您所见,当前 GDB 在第 77 行只知道 greeter 的静态类型。

Thread 1 "hello_image" hit Breakpoint 2, hello.Hello::main(java.lang.String[]*) (args=<optimized out>) at hello/Hello.java:77
77	        greeter.greet();
(gdb) p greeter
$17 = (hello.Hello$Greeter *) 0x7ff7f9101208

此外,您无法看到只存在于 NamedGreeter 子类中的字段。

(gdb) p *greeter
$18 = {
  <java.lang.Object> = {
    <_objhdr> = {
      hub = 0x1d1cae0
    }, <No data fields>}, <No data fields>}

但是您确实有 hub 字段,它指向对象的类对象。因此,它允许您确定地址 0x7ff7f9101208 处 Greeter 对象的运行时类型。

(gdb) p greeter.hub
$19 = (_z_.java.lang.Class *) 0x1d1cae0
(gdb) p *greeter.hub
$20 = {
  <java.lang.Class> = {
    <java.lang.Object> = {
      <_objhdr> = {
        hub = 0x1bec910
      }, <No data fields>}, 
    members of java.lang.Class:
    typeCheckStart = 1188,
    name = 0xb94a2, <<<< WE ARE INTERESTED IN THIS FIELD
    superHub = 0x90202,
    ...
    monitorOffset = 8,
    optionalIdentityHashOffset = 12,
    flags = 0,
    instantiationFlags = 3 '\003'
  }, <No data fields>}
(gdb) p greeter.hub.name
$21 = (_z_.java.lang.String *) 0xb94a2
(gdb) p greeter.hub.name.value.data
$22 = 0x7ff7f80705b8 "hello.Hello$NamedGreeter\351\001~*"

因此,您了解到该对象的实际类型是 hello.Hello$NamedGreeter

现在转换为该类型。

(gdb) set $rt_greeter = ('hello.Hello$NamedGreeter' *) greeter

现在您可以检查向下转型的便捷变量 rt_greeter

(gdb) p $rt_greeter
$23 = (hello.Hello$NamedGreeter *) 0x7ff7f9101208
(gdb) p *$rt_greeter
$24 = {
  <hello.Hello$Greeter> = {
    <java.lang.Object> = {
      <_objhdr> = {
        hub = 0x1d1cae0
      }, <No data fields>}, <No data fields>}, 
  members of hello.Hello$NamedGreeter:
  name = 0x270119
}

现在您可以看到只存在于 NamedGreeter 子类型中的 name 字段。

(gdb) p $rt_greeter.name
$25 = (_z_.java.lang.String *) 0x270119

因此 name 字段的类型是 String。您已经知道如何查看 String 的内容。

(gdb) p $rt_greeter.name.value.data
$26 = 0x7ff7f91008c0 "FooBar\376\376\200G\273\001\027\001'"

注意:如果您要向下转型的静态类型是压缩引用,那么向下转型中使用的类型也需要是压缩引用类型。

例如,如果您有

(gdb) p elementData.data[0]

$38 = (_z_.java.lang.Object *) 0x290fcc

ArrayList 的内部数组中,第一个条目指向一个带有 _z_. 前缀的 java.lang.Object,表示这是一个压缩引用

要检查该对象的运行时类型是什么,请使用

(gdb) p elementData.data[0].hub.name.value.data

$40 = 0x7ff7f8665600 "java.lang.String=\256\271`"

现在您知道压缩引用实际上指向一个 java.lang.String

然后,当您进行类型转换时,不要忘记使用 _z_. 前缀。

(gdb) p ('_z_.java.lang.String' *) elementData.data[0]

$41 = (_z_.java.lang.String *) 0x290fcc
(gdb) p *$41

$43 = {
  <java.lang.String> = {
    <java.lang.Object> = {
      <_objhdr> = {
        hub = 0x1bb4780
      }, <No data fields>}, 
    members of java.lang.String:
    value = 0x290fce,
    ...

要查看该 String 的内容,再次使用

(gdb) p $41.value.data

$44 = 0x7ff7f9207e78 "#subsys_name\thierarchy\tnum_cgroups\tenabled"

在实例方法中使用 this 变量

(gdb) bt
#0  hello.Hello$NamedGreeter::greet() (this=0x7ff7f9101208) at hello/Hello.java:71
#1  0x000000000083c060 in hello.Hello::main(java.lang.String[]*) (args=<optimized out>) at hello/Hello.java:77
#2  0x0000000000413355 in com.oracle.svm.core.JavaMainWrapper::runCore0() () at com/oracle/svm/core/JavaMainWrapper.java:178
#3  0x00000000004432e5 in com.oracle.svm.core.JavaMainWrapper::runCore() () at com/oracle/svm/core/JavaMainWrapper.java:136
#4  com.oracle.svm.core.JavaMainWrapper::doRun(int, org.graalvm.nativeimage.c.type.CCharPointerPointer*) (argc=<optimized out>, argv=<optimized out>) at com/oracle/svm/core/JavaMainWrapper.java:233
#5  com.oracle.svm.core.JavaMainWrapper::run(int, org.graalvm.nativeimage.c.type.CCharPointerPointer*) (argc=<optimized out>, argv=<optimized out>) at com/oracle/svm/core/JavaMainWrapper.java:219
#6  com.oracle.svm.core.code.IsolateEnterStub::JavaMainWrapper_run_e6899342f5939c89e6e2f78e2c71f5f4926b786d(int, org.graalvm.nativeimage.c.type.CCharPointerPointer*) (__0=<optimized out>, __1=<optimized out>)
at com/oracle/svm/core/code/IsolateEnterStub.java:1
(gdb) p this
$1 = (hello.Hello$NamedGreeter *) 0x7ff7f9001218
(gdb) p *this
$2 = {
  <hello.Hello$Greeter> = {
    <java.lang.Object> = {
      <_objhdr> = {
        hub = 0x1de2260
      }, <No data fields>}, <No data fields>}, 
  members of hello.Hello$NamedGreeter:
  name = 0x25011b
}
(gdb) p this.name
$3 = (_z_.java.lang.String *) 0x270119

就像在 Java 或 C++ 代码中一样,在实例方法中,不需要加 this. 前缀。

(gdb) p name
$7 = (_z_.java.lang.String *) 0x270119
(gdb) p name.value.data
$8 = 0x7ff7f91008c0 "FooBar\376\376\200G\273\001\027\001'"

访问静态字段

虽然在打印对象实例时会显示静态字段,但您只想查看特定静态字段的值。

(gdb) p 'java.math.BigDecimal::BIG_TEN_POWERS_TABLE'
$23 = (_z_.java.math.BigInteger[] *) 0x132b95

要获取所有静态字段的列表,请使用

(gdb) info variables ::

检查 .class 对象

对于镜像中的每个 Java 类型,都有一种简单的方法来访问其类对象(也称为 hub)。

(gdb) info types PrintStream
All types matching regular expression "PrintStream":

...
File java/io/PrintStream.java:
	java.io.PrintStream;
	java.io.PrintStream$1;
...

要访问 java.io.PrintStream 的 hub,可以使用 .class 后缀

(gdb) p 'java.io.PrintStream.class'
$4 = {
  <java.lang.Object> = {
    <_objhdr> = {
      hub = 0x1bec910
    }, <No data fields>}, 
  members of java.lang.Class:
  typeCheckStart = 1340,
  name = 0xbab58,
  superHub = 0x901ba,
  ...
  sourceFileName = 0xbab55,
  classInitializationInfo = 0x14d189,
  module = 0x14cd8d,
  nestHost = 0xde78d,
  simpleBinaryName = 0x0,
  companion = 0x149856,
  signature = 0x0,
  ...
}

例如,这允许您检查 java.io.PrintStream 属于哪个模块。

(gdb) p 'java.io.PrintStream.class'.module.name.value.data
$12 = 0x7ff7f866b000 "java.base"

内联方法

PrintStream.writeln 中设置断点

(gdb) b java.io.PrintStream::writeln
Breakpoint 2 at 0x4080cb: java.io.PrintStream::writeln. (35 locations)

现在您导航到

(gdb) bt
#0  java.io.BufferedWriter::min(int, int) (this=<optimized out>, a=8192, b=14) at java/io/BufferedWriter.java:216
#1  java.io.BufferedWriter::implWrite(java.lang.String*, int, int) (this=0x7ff7f884e828, s=0x7ff7f9101230, off=<optimized out>, len=<optimized out>) at java/io/BufferedWriter.java:329
#2  0x000000000084c50d in java.io.BufferedWriter::write(java.lang.String*, int, int) (this=<optimized out>, s=<optimized out>, off=<optimized out>, len=<optimized out>) at java/io/BufferedWriter.java:313
#3  0x0000000000901369 in java.io.Writer::write(java.lang.String*) (this=<optimized out>, str=<optimized out>) at java/io/Writer.java:278
#4  0x00000000008df465 in java.io.PrintStream::implWriteln(java.lang.String*) (this=0x7ff7f87e67b8, s=<optimized out>) at java/io/PrintStream.java:846
#5  0x00000000008e10a5 in java.io.PrintStream::writeln(java.lang.String*) (this=0x7ff7f87e67b8, s=<optimized out>) at java/io/PrintStream.java:826
#6  0x000000000083c00c in java.io.PrintStream::println(java.lang.String*) (this=<optimized out>, x=<optimized out>) at java/io/PrintStream.java:1168
#7  hello.Hello$NamedGreeter::greet() (this=<optimized out>) at hello/Hello.java:71
#8  0x000000000083c060 in hello.Hello::main(java.lang.String[]*) (args=<optimized out>) at hello/Hello.java:77
#9  0x0000000000413355 in com.oracle.svm.core.JavaMainWrapper::runCore0() () at com/oracle/svm/core/JavaMainWrapper.java:178
#10 0x00000000004432e5 in com.oracle.svm.core.JavaMainWrapper::runCore() () at com/oracle/svm/core/JavaMainWrapper.java:136
#11 com.oracle.svm.core.JavaMainWrapper::doRun(int, org.graalvm.nativeimage.c.type.CCharPointerPointer*) (argc=<optimized out>, argv=<optimized out>) at com/oracle/svm/core/JavaMainWrapper.java:233
#12 com.oracle.svm.core.JavaMainWrapper::run(int, org.graalvm.nativeimage.c.type.CCharPointerPointer*) (argc=<optimized out>, argv=<optimized out>) at com/oracle/svm/core/JavaMainWrapper.java:219
#13 com.oracle.svm.core.code.IsolateEnterStub::JavaMainWrapper_run_e6899342f5939c89e6e2f78e2c71f5f4926b786d(int, org.graalvm.nativeimage.c.type.CCharPointerPointer*) (__0=<optimized out>, __1=<optimized out>)
    at com/oracle/svm/core/code/IsolateEnterStub.java:1

如果您查询顶层帧的额外信息,您会看到 min 已内联到 implWrite 中。

(gdb) info frame
Stack level 0, frame at 0x7fffffffdb20:
 rip = 0x84af8a in java.io.BufferedWriter::min(int, int) (java/io/BufferedWriter.java:216); saved rip = 0x84c50d
 inlined into frame 1
 source language unknown.
 Arglist at unknown address.
 Locals at unknown address, Previous frame's sp in rsp

现在单步进入 min 的使用点,您会看到 min 返回了值 14(正如预期)。

(gdb) bt
#0  java.lang.String::getChars(int, int, char[]*, int) (this=0x7ff7f9101230, srcBegin=0, srcEnd=14, dst=0x7ff7f858ac58, dstBegin=0) at java/lang/String.java:1688
#1  java.io.BufferedWriter::implWrite(java.lang.String*, int, int) (this=0x7ff7f884e828, s=0x7ff7f9101230, off=<optimized out>, len=<optimized out>) at java/io/BufferedWriter.java:330
...

在调试期间调用 svm_dbg_ 辅助函数

当镜像使用 -H:+IncludeDebugHelperMethods 构建时,会定义额外的 @CEntryPoint 函数,这些函数可以在调试期间从 GDB 调用,例如

(gdb) p greeter 
$3 = (hello.Hello$Greeter *) 0x7ffff6881900

这里,您再次有一个名为 greeter 的局部变量,其静态类型为 hello.Hello$Greeter。要查看其运行时类型,您可以使用上面已描述的方法。

或者,您可以使用 svm_dbg_ 辅助函数。例如,在正在运行的调试会话中,您可以调用

void svm_dbg_print_hub(graal_isolatethread_t* thread, size_t hubPtr)

您必须传递 graal_isolatethread_t 的值以及您要打印的 hub 的绝对地址。在大多数情况下,graal_isolatethread_t 的值就是当前 IsolateThread 的值,可以在特定于平台的寄存器中找到。

平台 寄存器
amd64 $r15
aarch64 $r28

最后,在您可以调用 svm_dbg_print_hub 之前,请确保您拥有要打印的 hub 的绝对地址。使用

(gdb) p greeter.hub
$4 = (_z_.java.lang.Class *) 0x837820 <java.io.ObjectOutputStream::ObjectOutputStream(java.io.OutputStream*)+1120>

显示在当前情况下,greeter 中的 hub 字段包含对 hub 的压缩引用(hub-type 前缀为 _z_.)。因此,您首先需要使用另一个 svm_dbg_ 辅助方法获取 hub 字段的绝对地址。

(gdb) call svm_dbg_obj_uncompress($r15, greeter.hub)
$5 = 140737339160608
(gdb) p/x $5
$6 = 0x7ffff71b7820

在调用 svm_dbg_obj_uncompress 的帮助下,您现在知道 hub 位于地址 0x7ffff71b7820,并且最终可以调用 svm_dbg_print_hub

(gdb) call (void) svm_dbg_print_hub($r15, 0x7ffff71b7820)
hello.Hello$NamedGreeter

这两个对 svm_dbg_ 辅助函数的调用可以组合成一个命令行。

(gdb) call (void) svm_dbg_print_hub($r15, svm_dbg_obj_uncompress($r15, greeter.hub))
hello.Hello$NamedGreeter

当前定义了以下 svm_dbg_ 辅助方法

int svm_dbg_ptr_isInImageHeap(graal_isolatethread_t* thread, size_t ptr);
int svm_dbg_ptr_isObject(graal_isolatethread_t* thread, size_t ptr);
int svm_dbg_hub_getLayoutEncoding(graal_isolatethread_t* thread, size_t hubPtr);
int svm_dbg_hub_getArrayElementSize(graal_isolatethread_t* thread, size_t hubPtr);
int svm_dbg_hub_getArrayBaseOffset(graal_isolatethread_t* thread, size_t hubPtr);
int svm_dbg_hub_isArray(graal_isolatethread_t* thread, size_t hubPtr);
int svm_dbg_hub_isPrimitiveArray(graal_isolatethread_t* thread, size_t hubPtr);
int svm_dbg_hub_isObjectArray(graal_isolatethread_t* thread, size_t hubPtr);
int svm_dbg_hub_isInstance(graal_isolatethread_t* thread, size_t hubPtr);
int svm_dbg_hub_isReference(graal_isolatethread_t* thread, size_t hubPtr);
long long int svm_dbg_obj_getHub(graal_isolatethread_t* thread, size_t objPtr);
long long int svm_dbg_obj_getObjectSize(graal_isolatethread_t* thread, size_t objPtr);
int svm_dbg_obj_getArrayElementSize(graal_isolatethread_t* thread, size_t objPtr);
long long int svm_dbg_obj_getArrayBaseOffset(graal_isolatethread_t* thread, size_t objPtr);
int svm_dbg_obj_isArray(graal_isolatethread_t* thread, size_t objPtr);
int svm_dbg_obj_isPrimitiveArray(graal_isolatethread_t* thread, size_t objPtr);
int svm_dbg_obj_isObjectArray(graal_isolatethread_t* thread, size_t objPtr);
int svm_dbg_obj_isInstance(graal_isolatethread_t* thread, size_t objPtr);
int svm_dbg_obj_isReference(graal_isolatethread_t* thread, size_t objPtr);
long long int svm_dbg_obj_uncompress(graal_isolatethread_t* thread, size_t compressedPtr);
long long int svm_dbg_obj_compress(graal_isolatethread_t* thread, size_t objPtr);
int svm_dbg_string_length(graal_isolatethread_t* thread, size_t strPtr);
void svm_dbg_print_hub(graal_isolatethread_t* thread, size_t hubPtr);
void svm_dbg_print_obj(graal_isolatethread_t* thread, size_t objPtr);
void svm_dbg_print_string(graal_isolatethread_t* thread, size_t strPtr);
void svm_dbg_print_fatalErrorDiagnostics(graal_isolatethread_t* thread, size_t sp, void * ip);
void svm_dbg_print_locationInfo(graal_isolatethread_t* thread, size_t mem);

联系我们