Bun

FFI

使用内置的 bun:ffi 模块可以高效地从 JavaScript 调用本机库。它适用于支持 C ABI 的语言(Zig、Rust、C/C++、C#、Nim、Kotlin 等)。

用法 (bun:ffi)

要打印 sqlite3 的版本号

import { dlopen, FFIType, suffix } from "bun:ffi";

// `suffix` is either "dylib", "so", or "dll" depending on the platform
// you don't have to use "suffix", it's just there for convenience
const path = `libsqlite3.${suffix}`;

const {
  symbols: {
    sqlite3_libversion, // the function to call
  },
} = dlopen(
  path, // a library name or file path
  {
    sqlite3_libversion: {
      // no arguments, returns a string
      args: [],
      returns: FFIType.cstring,
    },
  },
);

console.log(`SQLite 3 version: ${sqlite3_libversion()}`);

性能

根据 我们的基准测试bun:ffi 比通过 Node-API 的 Node.js FFI 快约 2-6 倍。

Bun 生成并即时编译 C 绑定,可以在 JavaScript 类型和本机类型之间高效地转换值。为了编译 C,Bun 嵌入了 TinyCC,这是一个小巧且快速的 C 编译器。

Zig

// add.zig
pub export fn add(a: i32, b: i32) i32 {
  return a + b;
}

编译

zig build-lib add.zig -dynamic -OReleaseFast

传递共享库的路径和要导入到 dlopen 中的符号映射

import { dlopen, FFIType, suffix } from "bun:ffi";
const { i32 } = FFIType;

const path = `libadd.${suffix}`;

const lib = dlopen(path, {
  add: {
    args: [i32, i32],
    returns: i32,
  },
});

console.log(lib.symbols.add(1, 2));

Rust

// add.rs
#[no_mangle]
pub extern "C" fn add(a: i32, b: i32) -> i32 {
    a + b
}

编译

rustc --crate-type cdylib add.rs

C++

#include <cstdint>

extern "C" int32_t add(int32_t a, int32_t b) {
    return a + b;
}

编译

zig build-lib add.cpp -dynamic -lc -lc++

FFI 类型

支持以下 FFIType 值。

FFITypeC 类型别名
cstringchar*
function(void*)(*)()fn, callback
ptrvoid*pointer, void*, char*
i8int8_tint8_t
i16int16_tint16_t
i32int32_tint32_t, int
i64int64_tint64_t
i64_fastint64_t
u8uint8_tuint8_t
u16uint16_tuint16_t
u32uint32_tuint32_t
u64uint64_tuint64_t
u64_fastuint64_t
f32floatfloat
f64doubledouble
boolbool
charchar

字符串

JavaScript 字符串和类似 C 的字符串是不同的,这使得将字符串与本机库一起使用变得复杂。

JavaScript 字符串和 C 字符串有何不同?

为了解决这个问题,bun:ffi 导出了 CString,它扩展了 JavaScript 的内置 String 以支持以空字符结尾的字符串并添加了一些额外内容

class CString extends String {
  /**
   * Given a `ptr`, this will automatically search for the closing `\0` character and transcode from UTF-8 to UTF-16 if necessary.
   */
  constructor(ptr: number, byteOffset?: number, byteLength?: number): string;

  /**
   * The ptr to the C string
   *
   * This `CString` instance is a clone of the string, so it
   * is safe to continue using this instance after the `ptr` has been
   * freed.
   */
  ptr: number;
  byteOffset?: number;
  byteLength?: number;
}

将以空字符结尾的字符串指针转换为 JavaScript 字符串

const myString = new CString(ptr);

将具有已知长度的指针转换为 JavaScript 字符串

const myString = new CString(ptr, 0, byteLength);

new CString() 构造函数克隆了 C 字符串,因此在释放 ptr 后可以安全地继续使用 myString

my_library_free(myString.ptr);

// this is safe because myString is a clone
console.log(myString);

returns 中使用时,FFIType.cstring 将指针强制转换为 JavaScript string。在 args 中使用时,FFIType.cstringptr 相同。

函数指针

注意 — 异步函数尚不受支持。

要从 JavaScript 调用函数指针,请使用 CFunction。如果在 Bun 中使用 Node-API (napi),并且已经加载了一些符号,这将很有用。

import { CFunction } from "bun:ffi";

let myNativeLibraryGetVersion = /* somehow, you got this pointer */

const getVersion = new CFunction({
  returns: "cstring",
  args: [],
  ptr: myNativeLibraryGetVersion,
});
getVersion();

如果有多个函数指针,可以使用 linkSymbols 一次定义所有函数指针

import { linkSymbols } from "bun:ffi";

// getVersionPtrs defined elsewhere
const [majorPtr, minorPtr, patchPtr] = getVersionPtrs();

const lib = linkSymbols({
  // Unlike with dlopen(), the names here can be whatever you want
  getMajor: {
    returns: "cstring",
    args: [],

    // Since this doesn't use dlsym(), you have to provide a valid ptr
    // That ptr could be a number or a bigint
    // An invalid pointer will crash your program.
    ptr: majorPtr,
  },
  getMinor: {
    returns: "cstring",
    args: [],
    ptr: minorPtr,
  },
  getPatch: {
    returns: "cstring",
    args: [],
    ptr: patchPtr,
  },
});

const [major, minor, patch] = [
  lib.symbols.getMajor(),
  lib.symbols.getMinor(),
  lib.symbols.getPatch(),
];

回调

使用 JSCallback 创建可以传递给 C/FFI 函数的 JavaScript 回调函数。C/FFI 函数可以调用 JavaScript/TypeScript 代码。这对于异步代码或在需要从 C 调用 JavaScript 代码时很有用。

import { dlopen, JSCallback, ptr, CString } from "bun:ffi";

const {
  symbols: { search },
  close,
} = dlopen("libmylib", {
  search: {
    returns: "usize",
    args: ["cstring", "callback"],
  },
});

const searchIterator = new JSCallback(
  (ptr, length) => /hello/.test(new CString(ptr, length)),
  {
    returns: "bool",
    args: ["ptr", "usize"],
  },
);

const str = Buffer.from("wwutwutwutwutwutwutwutwutwutwutut\0", "utf8");
if (search(ptr(str), searchIterator)) {
  // found a match!
}

// Sometime later:
setTimeout(() => {
  searchIterator.close();
  close();
}, 5000);

使用完 JSCallback 后,应调用 close() 以释放内存。

⚡️ 性能提示 — 为了略微提升性能,直接传递 JSCallback.prototype.ptr,而不是 JSCallback 对象

const onResolve = new JSCallback(arg => arg === 42, {
  returns: "bool",
  args: ["i32"],
});
const setOnResolve = new CFunction({
  returns: "bool",
  args: ["function"],
  ptr: myNativeLibrarySetOnResolve,
});

// This code runs slightly faster:
setOnResolve(onResolve.ptr);

// Compared to this:
setOnResolve(onResolve);

指针

Bun 将 指针 表示为 JavaScript 中的 number

64 位指针如何放入 JavaScript 数值中?

TypedArray 转换为指针

import { ptr } from "bun:ffi";
let myTypedArray = new Uint8Array(32);
const myPtr = ptr(myTypedArray);

从指针转换为 ArrayBuffer

import { ptr, toArrayBuffer } from "bun:ffi";
let myTypedArray = new Uint8Array(32);
const myPtr = ptr(myTypedArray);

// toArrayBuffer accepts a `byteOffset` and `byteLength`
// if `byteLength` is not provided, it is assumed to be a null-terminated pointer
myTypedArray = new Uint8Array(toArrayBuffer(myPtr, 0, 32), 0, 32);

要从指针读取数据,你有两个选择。对于长期指针,使用 DataView

import { toArrayBuffer } from "bun:ffi";
let myDataView = new DataView(toArrayBuffer(myPtr, 0, 32));

console.log(
  myDataView.getUint8(0, true),
  myDataView.getUint8(1, true),
  myDataView.getUint8(2, true),
  myDataView.getUint8(3, true),
);

对于短期指针,使用 read

import { read } from "bun:ffi";

console.log(
  // ptr, byteOffset
  read.u8(myPtr, 0),
  read.u8(myPtr, 1),
  read.u8(myPtr, 2),
  read.u8(myPtr, 3),
);

read 函数的行为类似于 DataView,但它通常更快,因为它不需要创建 DataViewArrayBuffer

FFITyperead 函数
ptrread.ptr
i8read.i8
i16read.i16
i32read.i32
i64read.i64
u8read.u8
u16read.u16
u32read.u32
u64read.u64
f32read.f32
f64read.f64

内存管理

bun:ffi 不会为你管理内存。使用完后,你必须释放内存。

从 JavaScript

如果你想追踪 TypedArray 何时不再从 JavaScript 中使用,你可以使用 FinalizationRegistry

从 C、Rust、Zig 等

如果你想追踪 TypedArray 何时不再从 C 或 FFI 中使用,你可以将回调和可选的上下文指针传递给 toArrayBuffertoBuffer。此函数稍后在某个时间点调用,一旦垃圾回收器释放了底层的 ArrayBuffer JavaScript 对象。

预期的签名与 JavaScriptCore 的 C API 中的签名相同

typedef void (*JSTypedArrayBytesDeallocator)(void *bytes, void *deallocatorContext);
import { toArrayBuffer } from "bun:ffi";

// with a deallocatorContext:
toArrayBuffer(
  bytes,
  byteOffset,

  byteLength,

  // this is an optional pointer to a callback
  deallocatorContext,

  // this is a pointer to a function
  jsTypedArrayBytesDeallocator,
);

// without a deallocatorContext:
toArrayBuffer(
  bytes,
  byteOffset,

  byteLength,

  // this is a pointer to a function
  jsTypedArrayBytesDeallocator,
);

内存安全性

强烈不建议在 FFI 之外使用原始指针。Bun 的未来版本可能会添加 CLI 标志以禁用 bun:ffi

指针对齐

如果 API 期望指针大小为 charu8 之外的其他大小,请确保 TypedArray 也为该大小。u64*[8]u8* 并不完全相同,因为对齐方式不同。

传递指针

在 FFI 函数期望指针的地方,传递大小相等的 TypedArray

import { dlopen, FFIType } from "bun:ffi";

const {
  symbols: { encode_png },
} = dlopen(myLibraryPath, {
  encode_png: {
    // FFIType's can be specified as strings too
    args: ["ptr", "u32", "u32"],
    returns: FFIType.ptr,
  },
});

const pixels = new Uint8ClampedArray(128 * 128 * 4);
pixels.fill(254);
pixels.subarray(0, 32 * 32 * 2).fill(0);

const out = encode_png(
  // pixels will be passed as a pointer
  pixels,

  128,
  128,
);

自动生成的包装器将指针转换为 TypedArray

困难模式

读取指针

const out = encode_png(
  // pixels will be passed as a pointer
  pixels,

  // dimensions:
  128,
  128,
);

// assuming it is 0-terminated, it can be read like this:
let png = new Uint8Array(toArrayBuffer(out));

// save it to disk:
await Bun.write("out.png", png);