查壳

在jadx中,基本什么都看得到,应该没有加整体壳。
抓包(/x/resource/fingerprint)
url
抓的包,访问链接如下。——指纹接口。
1
| https://app.bilibili.com/x/resource/fingerprint?appkey=1d8b6e7d45233436&build=8480300&c_locale=zh_CN&channel=vivo&disable_rcmd=0&mobi_app=android&platform=android&s_locale=zh_CN&statistics=%7B%22appId%22%3A1%2C%22platform%22%3A3%2C%22version%22%3A%228.48.0%22%2C%22abtest%22%3A%22%22%7D&ts=1751439861&sign=9168aa232e8a21024f1276dabbd6682a
|
参数
参数如下。
appkey一般是一个app固定的东西;
build是版本号;
statistics记录了一些基本信息。
sign是一个签名。
对一些参数进行删减,发现只要留下platform和sign便能获得正确的响应。

请求头
请求头如下。
fp_local是本地指纹;
buvid似乎也是指纹。
两者有什么区别呢:
1 2 3
| 一个形象的比喻,假设进入一个高级俱乐部需要验证身份: buvid 就像是你的会员卡。这张卡一旦办好,上面的会员号是固定不变的。你每次来,出示这张卡,俱乐部就知道你是谁,你过往的消费记录是怎样的。 fp_local 就像是门口的人脸识别+安检。你每次进门时,系统会实时扫描你的脸、你的穿着打扮、你有没有带危险品(即你当前的设备环境)。这个扫描结果就是你的fp_local。
|
请求头全撤了,也能得到正确响应。(这样可能会触发风控,毕竟请求头太奇怪了)

请求体
请求体包含2个部分,key和content,稍微动1个字节都会引发错误。
1 2 3 4
| { "key": "B5592D6C3EC9EDB4A217370C2502098C71296E7A91A922F90F01F1AD1C4FFD9D7A140879D503DB12E153E4AB41051B413E95C7C5F6AC4681EA65FF7EA8055F0B336EA750E31980F70DAD33448607D3A8CAFA3D149D106758296B8EA448498C967452D58EF5E01694CBE128686C6ECCC98593895E01981CC33AE043288BDFE520", "content": "" }
|
分析
sign
定位
常规操作,在jadx中搜索”sign”,观察能否直接定位到目标代码。
根据包名,这几个出现”sign”的地方,似乎都不是为sign写入加密数据的地方。

那就使用frida,hook函数java.util.Map。
然鹅,遇到了frida检测。
绕过了反调后,依旧没有打印内容,说明不是使用java.util.Map存储键值对的。
还有两个办法。
一是抓包,打印调用栈,对着调用栈分析sign的加密点;
二是在jadx中搜索关于sign的其它字符串,因为之前搜索的是"sign",如果去掉双引号,得到的结果会更多。——有可能用的是字符串拼接的方式。
由于分析调用栈太麻烦,这里先尝试搜索sign=。

发现结果相比搜索"sign"多了许多,从上图的结果来看,大概率使用的就是字符串拼接,进一步缩小范围:&sign=。

有两处比较像加密点。
一个是:
hook了这个函数,结果如下。

根据比对,这个sign大概率是访问/x/push/token时的签名,而不是访问/x/resource/fingerprint时的签名。

另一个是:
对它进行hook。
1
| actionKey=appkey&appkey=1d8b6e7d45233436&build=8480300&c_locale=zh_CN&channel=vivo&device=android&disable_rcmd=0&mobi_app=android&platform=android&s_locale=zh_CN&statistics=%7B%22appId%22%3A1%2C%22platform%22%3A3%2C%22version%22%3A%228.48.0%22%2C%22abtest%22%3A%22%22%7D&ts=1751452489&version=8.48.0&sign=f7f2223690261f5c1c79da1725187a14
|
可以发现,大部分内容基本一致,基本可以确认,这里的this.sign就是目标sign。
根据交叉引用,this.sign的赋值来自SignedQuery的构造函数。

而构造函数在java层无任何引用,大概率是在native层创建的实例。
根据追踪,signQuery会返回一个SignedQuery实例,

对应的库名是libbili.so。
如何定位函数s在native层的动态绑定地址呢?
方法1:
如果要hook RegisterNatives,由于存在反调试,在处理完反调试之前,是不能hook RegisterNatives的——反调不是在第一时间就能hook绕过的;如果在处理完反调之后,再hook RegisterNatives,又会错过一些JNI函数的注册。这个hook的时机不好把握。
方法2:
又或者用Unidbg模拟执行libbili.so,但只是为了看注册地址就去补环境,有点杀鸡用牛刀的感觉。
方法3:
这里有一个点子。
每一个Java函数都对应着C/C++的一个ArtMethod结构体实例,可以遍历类的所有函数,然后拿到它们的handle句柄(ArtMethod地址),然后通过偏移,在ArtMethod的成员变量中找到绑定的Native地址,然后根据这个地址,判断位于哪个模块,函数的实际地址再减去模块基址,就可以得到文件内偏移地址了。
这个方式相对于前面2种方式,优点在于:可以任意时机获得偏移地址(也就是说,可以绕过反调再获得);而且不用大费周章补环境。
实现效果如下,还不错。
1 2 3 4
| [+] Java Method: com.bilibili.nativelibrary.LibBili.s(java.util.SortedMap) |-- Method Handle: 0x9f149638 |-- Native Address: 0x797cf0a050 `-- Symbol Details: 0x9050 (offset: 0x9050 in libbili.so)
|
解密字符串
.datadiv_decodexxxxx是ollvm对字符串加密的特征。
在dump完并且修复后,字符串基本都解密完了,多了300多个字符串 。
分析
来到sub_9050。
进入sub_162A8,从return倒推。

v21和v7应该对应于str、str2。
倒推,分析sub_18FF0。
一路往里找加密算法,最后来到sub_106C4。
各种位移、异或、与、非操作,大概率是md5。
注意到,第248行有一个-680876936,转换成十六进制,相当于0xD76AA478,这正是MD5的T盒中的常数之一。

同时,注意到存在(v5 >> 3) & 63的操作,在md5中,这一般是获得字节数的操作。
同时,在函数sub_FFAC发现了魔数赋值的地方。
上述种种说明,这是一个md5运算,就是不知道有没有魔改。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27
| 输入: 0 1 2 3 4 5 6 7 8 9 A B C D E F 0123456789ABCDEF 7b4fb95310 61 63 63 65 73 73 5f 6b 65 79 3d 26 61 70 70 6b access_key=&appk 7b4fb95320 65 79 3d 31 64 38 62 36 65 37 64 34 35 32 33 33 ey=1d8b6e7d45233 7b4fb95330 34 33 36 26 62 72 61 6e 64 3d 4f 6e 65 50 6c 75 436&brand=OnePlu 7b4fb95340 73 26 62 75 69 6c 64 3d 38 34 38 30 33 30 30 26 s&build=8480300& 7b4fb95350 63 5f 6c 6f 63 61 6c 65 3d 7a 68 5f 43 4e 26 63 c_locale=zh_CN&c 7b4fb95360 68 61 6e 6e 65 6c 3d 76 69 76 6f 26 64 69 73 61 hannel=vivo&disa 7b4fb95370 62 6c 65 5f 72 63 6d 64 3d 30 26 6d 56 65 72 73 ble_rcmd=0&mVers 7b4fb95380 69 6f 6e 3d 33 30 39 26 6d 61 6c 6c 56 65 72 73 ion=309&mallVers 7b4fb95390 69 6f 6e 3d 38 34 38 30 33 30 30 26 6d 6f 62 69 ion=8480300&mobi 7b4fb953a0 5f 61 70 70 3d 61 6e 64 72 6f 69 64 26 70 6c 61 _app=android&pla 7b4fb953b0 74 66 6f 72 6d 3d 61 6e 64 72 6f 69 64 26 73 5f tform=android&s_ 7b4fb953c0 6c 6f 63 61 6c 65 3d 7a 68 5f 43 4e 26 73 74 61 locale=zh_CN&sta 7b4fb953d0 74 69 73 74 69 63 73 3d 25 37 42 25 32 32 61 70 tistics=%7B%22ap 7b4fb953e0 70 49 64 25 32 32 25 33 41 31 25 32 43 25 32 32 pId%22%3A1%2C%22 7b4fb953f0 70 6c 61 74 66 6f 72 6d 25 32 32 25 33 41 33 25 platform%22%3A3% 7b4fb95400 32 43 25 32 32 76 65 72 73 69 6f 6e 25 32 32 25 2C%22version%22% 7b4fb95410 33 41 25 32 32 38 2e 34 38 2e 30 25 32 32 25 32 3A%228.48.0%22%2 7b4fb95420 43 25 32 32 61 62 74 65 73 74 25 32 32 25 33 41 C%22abtest%22%3A 7b4fb95430 25 32 32 25 32 32 25 37 44 26 74 72 69 62 65 56 %22%22%7D&tribeV 7b4fb95440 65 72 73 69 6f 6e 3d 30 26 74 73 3d 31 37 35 31 ersion=0&ts=1751 7b4fb95450 35 32 37 36 37 33 527673 输出: 0 1 2 3 4 5 6 7 8 9 A B C D E F 0123456789ABCDEF 7991c96590 31 35 31 30 66 39 39 39 62 33 62 39 38 38 31 37 1510f999b3b98817 7991c965a0 39 39 61 30 33 34 33 64 32 64 38 62 38 63 64 62 99a0343d2d8b8cdb
|
与标准的MD5结果不同,说明魔改了?(后来发现并没有)

魔数和M盒赋值并没有魔改。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
| v202 = *a1; v2 = a1[1]; v3 = a1[2]; v4 = a1[3]; v5 = 0; v6 = 0; v203 = v4; while ( v5 < 0x40 ) { for ( i = 0x180DFC9C; i != 0x94D2D6E7; i = 0x94D2D6E7 ) { *(&v207 + v6) = (*(unsigned __int8 *)(a2 + v5 + 3) << 24) | (*(unsigned __int8 *)(a2 + v5 + 1) << 8) ^ 0xF91793FF ^ ~*(unsigned __int8 *)(a2 + v5) & 0xF91793FF | (*(unsigned __int8 *)(a2 + v5 + 2) << 16); v205 = v6 + 1; v206 = v5 + 4; } v6 = v205; v5 = v206; }
|
根据分析,在1-64轮中:第11轮的|变成了^;
第16轮的|变成了^;
第19轮的|变成了^;
第25轮不是魔改,因为位移后,使用^或者|,效果都一样,图中是我弄错了。
第31轮的|变成了^;
至于11、16、19、31轮,经过试验,发现^和|的效果是一样的,也就是说,编译器和混淆的结果,并不是魔改。
所以,sub_1046C是标准的MD5 transform,基本可以判定MD5是标准的。

分析了函数sub_18ff0后,发现是加了IV,所以导致结果不同。
IV如下。
验证,这回对上了。
buvid
定位 && 分析
先定位到getBuvid。
this.f136924d.m467330e()会得到buvid_remote。
如果没有buvid_remote,就调用this.f136923c.m467322e()。
this.f403543a.get_buvid()会获得存储的buvid。

如果没存储,再调用m467316f(),获得buvid_compat。

如果没存储,再调用m467317g(),获得buvid_local。

如果上述哪个buvid是存储了的,会将它存放在buvid字段里。
buvid_remote是服务器发的官方buvid;buvid_compat是兼容旧版的buvid;buvid_local是设备本身生成的临时buvid;而buvid是当前有效的buvid。
这里主要去分析buvid_local是如何生成的。
追踪下面这个函数。
存在3个引用。

这里追踪第1个,如果找不到加密点,再追踪第2个。
查看引用。
其中,String strM467289e = this.f403533a instanceof AbstractC140824n.c ? this.f403534b.m467289e() : "";这一行代码是在获得存储的buvid2,我们的目标是计算获得buvid,所以这里继续追踪strM467289e = this.f403537e.mo367721a();。
this.f403537e是一个接口实例,它的赋值来自于这。


而InterfaceC107263b.f281975a.m367723a会返回一个类C109665c的实例。
这个实例覆写了函数a、b,并且调用了interfaceC107265d接口对象中的函数。
interfaceC107265d接口是如何实现的呢?追踪函数C140819i。

再查看this.f403544b的赋值。


查看C140822l的引用。


实现interfaceC107265d接口的对象是new C134862b(null, 1, null)。


接下来读代码,分析函数mo367721a()。
获得实现接口实例的函数a。
1
| InterfaceC107262a interfaceC107262aMo367726a = this._interface.mo367726a();
|
而函数a返回了一个接口实例对象。
只有类C109664b实现了这个接口,在new的时候,并没有对这个接口进行初始化,所以这里interfaceC107262aMo367726a只会得到null。

继续往下看,这回进行初始化了,传的接口是getLogger。
1 2 3
| if (interfaceC107262aMo367726a == null) { interfaceC107262aMo367726a = new C109664b(this._interface.getLogger()); }
|
而getLogger的返回值是this.f378652a。

所以相当于调用了new C109664b(null)。

继续往下看,获得了一个迭代器,根据当前的sdk版本,获得不同的接口列表。
1
| Iterator<InterfaceC107264c> it = this._interface.mo367728c().iterator();
|

我手机的版本是32,之后分析listListOf的接口列表。

接着分析下面的代码。
1 2 3 4 5 6 7 8 9 10 11 12 13
| Iterator<InterfaceC107264c> it = this._interface.mo367728c().iterator(); while (it.hasNext()) { String strMo367720a = interfaceC107262aMo367726a.mo367720a(it.next()); if (strMo367720a.length() != 0) { if (!this._interface.mo367727b().contains(strMo367720a)) { return strMo367720a; } Function1<String, Unit> logger = this._interface.getLogger(); if (logger != null) { logger.invoke(Intrinsics.stringPlus(strMo367720a, " is bad buvid")); } } }
|
上述代码中,只有下面2条关键语句——获得当前设备的buvid,如果不在黑名单中,便返回,作为buvid_local。
String strMo367720a = interfaceC107262aMo367726a.mo367720a(it.next());:获得接口函数处理后的字符串。
this._interface.mo367727b():获得黑名单buvid。
来看看是如何生成str的,由3部分组成。

以其中1个接口为例。
前缀是XU,调用mo367725d可以获得drmID。

来看看String strM375856c = C109666d.m375856c(strMo367725d,这是一个标准的MD5算法。

再看看C109666d.m375857d(strM375856c),取出md5结果的第2、12、22字节。

最终结果是:”<前缀> + <md5的2/12/22字节> + <md5结果>”。
最后,看看除了drmId,其它接口返回的是什么内容。
fp_local
定位 && 分析
搜出来的结果很少,可以一个一个看。由于大部分都是getXXX,这里直接可以锁定这一行。

函数m199614l中出现的字符串说明,fp_local与buvid有关。追踪C144128a.m475557a。

函数C144128a.m475557a长这个样子。

再看m475561e,是一个md5加密,对“buvid + 设备型号 + 基带版本信息”字符串进行md5运算。

而C105446f.m362260e是将hex字符串转换成字节数组。

函数m475563g返回了一个时间。

函数m475562f返回了随机的8个字节。

这就是本地指纹(fingerprint)的生成方式。
请求体分析(protobuf)
分析关于/x/resource/fingerprint的请求体。

定位 && 分析
搜索/x/resource/fingerprint。

对接口交叉引用,来到如下图所示的位置。

逐步分析。
ServiceGenerator.createService(InterfaceC9422e.class):创建一个网络请求服务的实例,ServiceGenrator是一个工厂类,用于生成实现了InterfaceC9422e接口的代理对象。
.fingerprint(str, ...):对应一个具体的api,str是请求参数,而另一个参数是http请求体,我们要分析的就是请求体。
这里的fingerprint并不涉及实现,只是告诉retrofit设置str作为查询参数到url中;设置requestBody作为POST请求的主体等。
RequestBody.create(MediaType.parse("application/json"), str2):创建了一个http请求体。
据上面的分析,可以知道str是请求参数字符串,str2是处理后的请求体,因此,下一步交叉引用m34466b,查看str2的来源。
this.f29694a和this.f29695b来自于RunnableC9421d,继续查询引用。

new PostBodyModel(str2, str3).toJsonString()是请求体。

继续追踪m34467c的引用,请求体和入参的str、data有关,继续追踪m27200a。

str来自于m199614l(),而data来自于C145722b.m479556b(Source.INIT)。

str取值为fp_local,至于fp_local的计算方式,之前分析过。
直接看return的内容,尝试获得main、property、sys数据。
1 2 3 4 5
| return new Data( setEmptySet.contains("main") ? MapsKt.emptyMap() : m479558d(setEmptySet, source), setEmptySet.contains("property") ? MapsKt.emptyMap() : C147370e.m483853a(), setEmptySet.contains("system") ? MapsKt.emptyMap() : C147367b.m483842f() );
|

main的数据如下。
property的数据在native层获得。

sys的数据如下。

可以将main、property、sys都视作设备指纹。
查看函数C98559a.m342912b(local_fp, data)做了什么。
函数m342911a长这个样子,点入任意一个c55998aNewBuilder的函数中,会发现跳转到了类com.bilibili.datacenter.hakase.protobuf.AndroidDeviceInfo$DeviceInfo。
这一步是将明文指纹转换成 protobuf编码。

再来看函数C101015b.m349014a,它将protobuf编码的字节数组进行了加密。
RSA.loadPublicKey(BiliContext.application().getAssets().open("rsa_public_key.pem"));:获得rsa公钥。

C101014a.m349012e():获得随机的128位数据,作为AES密钥。
RSA.encryptByPublicKey(strM349012e, rSAPublicKeyLoadPublicKey):用rsa公钥对aes密钥进行加密。
C101014a.m349009b(bArr, strM349012e):对protobuf编码的字节数组,进行aes加密。
new Pair<>(strEncryptByPublicKey, strM349009b:返回rsa加密的aes密钥和aes加密的protobuf数组。
之后就没什么好分析的了,将key和content转换成json格式传到服务器。

伪造指纹
先用frida hook关键点,得到protobuf数据。
再使用blackboxprotobuf对protobuf数据进行解析,修改字段值,修改后转回protobuf。
然后生成aes密钥,对protobuf内容加密。
用assets文件夹下的rsa公钥,对生成的aes密钥进行加密。
最后,将构造好的内容,替换掉正常包的请求体。
学习点
1.blackboxprotobuf的使用,定义proto文件。
2.mitmproxy可以抓取并解析protobuf报文。
3.reqable可以抓包、修改字段、发包、导出发包代码(python等语言)等。
4.如何定位关键字段的生成代码。