使用内置的 bun:ffi
模块可以高效地从 JavaScript 调用本机库。它适用于支持 C ABI 的语言(Zig、Rust、C/C++、C#、Nim、Kotlin 等)。
用法 (bun:ffi
)
要打印 sqlite3
的版本号
import { dlopen, FFIType, suffix } from "bun:ffi";
// `suffix` is either "dylib", "so", or "dll" depending on the platform
// you don't have to use "suffix", it's just there for convenience
const path = `libsqlite3.${suffix}`;
const {
symbols: {
sqlite3_libversion, // the function to call
},
} = dlopen(
path, // a library name or file path
{
sqlite3_libversion: {
// no arguments, returns a string
args: [],
returns: FFIType.cstring,
},
},
);
console.log(`SQLite 3 version: ${sqlite3_libversion()}`);
性能
根据 我们的基准测试,bun:ffi
比通过 Node-API
的 Node.js FFI 快约 2-6 倍。
Bun 生成并即时编译 C 绑定,可以在 JavaScript 类型和本机类型之间高效地转换值。为了编译 C,Bun 嵌入了 TinyCC,这是一个小巧且快速的 C 编译器。
Zig// add.zig
pub export fn add(a: i32, b: i32) i32 {
return a + b;
}
// add.zig
pub export fn add(a: i32, b: i32) i32 {
return a + b;
}
编译
zig build-lib add.zig -dynamic -OReleaseFast
传递共享库的路径和要导入到 dlopen
中的符号映射
import { dlopen, FFIType, suffix } from "bun:ffi";
const { i32 } = FFIType;
const path = `libadd.${suffix}`;
const lib = dlopen(path, {
add: {
args: [i32, i32],
returns: i32,
},
});
console.log(lib.symbols.add(1, 2));
Rust
// add.rs
#[no_mangle]
pub extern "C" fn add(a: i32, b: i32) -> i32 {
a + b
}
编译
rustc --crate-type cdylib add.rs
C++
#include <cstdint>
extern "C" int32_t add(int32_t a, int32_t b) {
return a + b;
}
编译
zig build-lib add.cpp -dynamic -lc -lc++
FFI 类型
支持以下 FFIType
值。
FFIType | C 类型 | 别名 |
---|---|---|
cstring | char* | |
function | (void*)(*)() | fn , callback |
ptr | void* | pointer , void* , char* |
i8 | int8_t | int8_t |
i16 | int16_t | int16_t |
i32 | int32_t | int32_t , int |
i64 | int64_t | int64_t |
i64_fast | int64_t | |
u8 | uint8_t | uint8_t |
u16 | uint16_t | uint16_t |
u32 | uint32_t | uint32_t |
u64 | uint64_t | uint64_t |
u64_fast | uint64_t | |
f32 | float | float |
f64 | double | double |
bool | bool | |
char | char |
字符串
JavaScript 字符串和类似 C 的字符串是不同的,这使得将字符串与本机库一起使用变得复杂。
JavaScript 字符串和 C 字符串有何不同?
为了解决这个问题,bun:ffi
导出了 CString
,它扩展了 JavaScript 的内置 String
以支持以空字符结尾的字符串并添加了一些额外内容
class CString extends String {
/**
* Given a `ptr`, this will automatically search for the closing `\0` character and transcode from UTF-8 to UTF-16 if necessary.
*/
constructor(ptr: number, byteOffset?: number, byteLength?: number): string;
/**
* The ptr to the C string
*
* This `CString` instance is a clone of the string, so it
* is safe to continue using this instance after the `ptr` has been
* freed.
*/
ptr: number;
byteOffset?: number;
byteLength?: number;
}
将以空字符结尾的字符串指针转换为 JavaScript 字符串
const myString = new CString(ptr);
将具有已知长度的指针转换为 JavaScript 字符串
const myString = new CString(ptr, 0, byteLength);
new CString()
构造函数克隆了 C 字符串,因此在释放 ptr
后可以安全地继续使用 myString
。
my_library_free(myString.ptr);
// this is safe because myString is a clone
console.log(myString);
在 returns
中使用时,FFIType.cstring
将指针强制转换为 JavaScript string
。在 args
中使用时,FFIType.cstring
与 ptr
相同。
函数指针
注意 — 异步函数尚不受支持。
要从 JavaScript 调用函数指针,请使用 CFunction
。如果在 Bun 中使用 Node-API (napi),并且已经加载了一些符号,这将很有用。
import { CFunction } from "bun:ffi";
let myNativeLibraryGetVersion = /* somehow, you got this pointer */
const getVersion = new CFunction({
returns: "cstring",
args: [],
ptr: myNativeLibraryGetVersion,
});
getVersion();
如果有多个函数指针,可以使用 linkSymbols
一次定义所有函数指针
import { linkSymbols } from "bun:ffi";
// getVersionPtrs defined elsewhere
const [majorPtr, minorPtr, patchPtr] = getVersionPtrs();
const lib = linkSymbols({
// Unlike with dlopen(), the names here can be whatever you want
getMajor: {
returns: "cstring",
args: [],
// Since this doesn't use dlsym(), you have to provide a valid ptr
// That ptr could be a number or a bigint
// An invalid pointer will crash your program.
ptr: majorPtr,
},
getMinor: {
returns: "cstring",
args: [],
ptr: minorPtr,
},
getPatch: {
returns: "cstring",
args: [],
ptr: patchPtr,
},
});
const [major, minor, patch] = [
lib.symbols.getMajor(),
lib.symbols.getMinor(),
lib.symbols.getPatch(),
];
回调
使用 JSCallback
创建可以传递给 C/FFI 函数的 JavaScript 回调函数。C/FFI 函数可以调用 JavaScript/TypeScript 代码。这对于异步代码或在需要从 C 调用 JavaScript 代码时很有用。
import { dlopen, JSCallback, ptr, CString } from "bun:ffi";
const {
symbols: { search },
close,
} = dlopen("libmylib", {
search: {
returns: "usize",
args: ["cstring", "callback"],
},
});
const searchIterator = new JSCallback(
(ptr, length) => /hello/.test(new CString(ptr, length)),
{
returns: "bool",
args: ["ptr", "usize"],
},
);
const str = Buffer.from("wwutwutwutwutwutwutwutwutwutwutut\0", "utf8");
if (search(ptr(str), searchIterator)) {
// found a match!
}
// Sometime later:
setTimeout(() => {
searchIterator.close();
close();
}, 5000);
使用完 JSCallback 后,应调用 close()
以释放内存。
⚡️ 性能提示 — 为了略微提升性能,直接传递 JSCallback.prototype.ptr
,而不是 JSCallback
对象
const onResolve = new JSCallback(arg => arg === 42, {
returns: "bool",
args: ["i32"],
});
const setOnResolve = new CFunction({
returns: "bool",
args: ["function"],
ptr: myNativeLibrarySetOnResolve,
});
// This code runs slightly faster:
setOnResolve(onResolve.ptr);
// Compared to this:
setOnResolve(onResolve);
指针
Bun 将 指针 表示为 JavaScript 中的 number
。
64 位指针如何放入 JavaScript 数值中?
从 TypedArray
转换为指针
import { ptr } from "bun:ffi";
let myTypedArray = new Uint8Array(32);
const myPtr = ptr(myTypedArray);
从指针转换为 ArrayBuffer
import { ptr, toArrayBuffer } from "bun:ffi";
let myTypedArray = new Uint8Array(32);
const myPtr = ptr(myTypedArray);
// toArrayBuffer accepts a `byteOffset` and `byteLength`
// if `byteLength` is not provided, it is assumed to be a null-terminated pointer
myTypedArray = new Uint8Array(toArrayBuffer(myPtr, 0, 32), 0, 32);
要从指针读取数据,你有两个选择。对于长期指针,使用 DataView
import { toArrayBuffer } from "bun:ffi";
let myDataView = new DataView(toArrayBuffer(myPtr, 0, 32));
console.log(
myDataView.getUint8(0, true),
myDataView.getUint8(1, true),
myDataView.getUint8(2, true),
myDataView.getUint8(3, true),
);
对于短期指针,使用 read
import { read } from "bun:ffi";
console.log(
// ptr, byteOffset
read.u8(myPtr, 0),
read.u8(myPtr, 1),
read.u8(myPtr, 2),
read.u8(myPtr, 3),
);
read
函数的行为类似于 DataView
,但它通常更快,因为它不需要创建 DataView
或 ArrayBuffer
。
FFIType | read 函数 |
---|---|
ptr | read.ptr |
i8 | read.i8 |
i16 | read.i16 |
i32 | read.i32 |
i64 | read.i64 |
u8 | read.u8 |
u16 | read.u16 |
u32 | read.u32 |
u64 | read.u64 |
f32 | read.f32 |
f64 | read.f64 |
内存管理
bun:ffi
不会为你管理内存。使用完后,你必须释放内存。
从 JavaScript
如果你想追踪 TypedArray
何时不再从 JavaScript 中使用,你可以使用 FinalizationRegistry。
从 C、Rust、Zig 等
如果你想追踪 TypedArray
何时不再从 C 或 FFI 中使用,你可以将回调和可选的上下文指针传递给 toArrayBuffer
或 toBuffer
。此函数稍后在某个时间点调用,一旦垃圾回收器释放了底层的 ArrayBuffer
JavaScript 对象。
预期的签名与 JavaScriptCore 的 C API 中的签名相同
typedef void (*JSTypedArrayBytesDeallocator)(void *bytes, void *deallocatorContext);
import { toArrayBuffer } from "bun:ffi";
// with a deallocatorContext:
toArrayBuffer(
bytes,
byteOffset,
byteLength,
// this is an optional pointer to a callback
deallocatorContext,
// this is a pointer to a function
jsTypedArrayBytesDeallocator,
);
// without a deallocatorContext:
toArrayBuffer(
bytes,
byteOffset,
byteLength,
// this is a pointer to a function
jsTypedArrayBytesDeallocator,
);
内存安全性
强烈不建议在 FFI 之外使用原始指针。Bun 的未来版本可能会添加 CLI 标志以禁用 bun:ffi
。
指针对齐
如果 API 期望指针大小为 char
或 u8
之外的其他大小,请确保 TypedArray
也为该大小。u64*
与 [8]u8*
并不完全相同,因为对齐方式不同。
传递指针
在 FFI 函数期望指针的地方,传递大小相等的 TypedArray
import { dlopen, FFIType } from "bun:ffi";
const {
symbols: { encode_png },
} = dlopen(myLibraryPath, {
encode_png: {
// FFIType's can be specified as strings too
args: ["ptr", "u32", "u32"],
returns: FFIType.ptr,
},
});
const pixels = new Uint8ClampedArray(128 * 128 * 4);
pixels.fill(254);
pixels.subarray(0, 32 * 32 * 2).fill(0);
const out = encode_png(
// pixels will be passed as a pointer
pixels,
128,
128,
);
自动生成的包装器将指针转换为 TypedArray
。
困难模式
读取指针
const out = encode_png(
// pixels will be passed as a pointer
pixels,
// dimensions:
128,
128,
);
// assuming it is 0-terminated, it can be read like this:
let png = new Uint8Array(toArrayBuffer(out));
// save it to disk:
await Bun.write("out.png", png);