Class ChatOllama

Ollama chat model integration.

Setup: Install @langchain/ollama and the Ollama app.

npm install @langchain/ollama

Runtime args can be passed as the second argument to any of the base runnable methods .invoke. .stream, .batch, etc. They can also be passed via .withConfig, or the second arg in .bindTools, like shown in the examples below:

// When calling `.withConfig`, call options should be passed via the first argument
const llmWithArgsBound = llm.withConfig({
  stop: ["\n"],
});

// When calling `.bindTools`, call options should be passed via the second argument
const llmWithTools = llm.bindTools(
  [...],
  {
    stop: ["\n"],
  }
);

Examples

Instantiate

import { ChatOllama } from '@langchain/ollama';

const llm = new ChatOllama({
  model: "llama-3.1:8b",
  temperature: 0,
  // other params...
});

Invoking

const input = `Translate "I love programming" into French.`;

// Models also accept a list of chat messages or a formatted prompt
const result = await llm.invoke(input);
console.log(result);

AIMessage {
  "content": "The translation of \"I love programming\" into French is:\n\n\"J'adore programmer.\"",
  "additional_kwargs": {},
  "response_metadata": {
    "model": "llama3.1:8b",
    "created_at": "2024-08-12T22:12:23.09468Z",
    "done_reason": "stop",
    "done": true,
    "total_duration": 3715571291,
    "load_duration": 35244375,
    "prompt_eval_count": 19,
    "prompt_eval_duration": 3092116000,
    "eval_count": 20,
    "eval_duration": 585789000
  },
  "tool_calls": [],
  "invalid_tool_calls": [],
  "usage_metadata": {
    "input_tokens": 19,
    "output_tokens": 20,
    "total_tokens": 39
  }
}

Streaming Chunks

for await (const chunk of await llm.stream(input)) {
  console.log(chunk);
}

AIMessageChunk {
  "content": "The",
  "additional_kwargs": {},
  "response_metadata": {},
  "tool_calls": [],
  "tool_call_chunks": [],
  "invalid_tool_calls": []
}
AIMessageChunk {
  "content": " translation",
  "additional_kwargs": {},
  "response_metadata": {},
  "tool_calls": [],
  "tool_call_chunks": [],
  "invalid_tool_calls": []
}
AIMessageChunk {
  "content": " of",
  "additional_kwargs": {},
  "response_metadata": {},
  "tool_calls": [],
  "tool_call_chunks": [],
  "invalid_tool_calls": []
}
AIMessageChunk {
  "content": " \"",
  "additional_kwargs": {},
  "response_metadata": {},
  "tool_calls": [],
  "tool_call_chunks": [],
  "invalid_tool_calls": []
}
AIMessageChunk {
  "content": "I",
  "additional_kwargs": {},
  "response_metadata": {},
  "tool_calls": [],
  "tool_call_chunks": [],
  "invalid_tool_calls": []
}
...
AIMessageChunk {
  "content": "",
  "additional_kwargs": {},
  "response_metadata": {},
  "tool_calls": [],
  "tool_call_chunks": [],
  "invalid_tool_calls": []
}
AIMessageChunk {
  "content": "",
  "additional_kwargs": {},
  "response_metadata": {
    "model": "llama3.1:8b",
    "created_at": "2024-08-12T22:13:22.22423Z",
    "done_reason": "stop",
    "done": true,
    "total_duration": 8599883208,
    "load_duration": 35975875,
    "prompt_eval_count": 19,
    "prompt_eval_duration": 7918195000,
    "eval_count": 20,
    "eval_duration": 643569000
  },
  "tool_calls": [],
  "tool_call_chunks": [],
  "invalid_tool_calls": [],
  "usage_metadata": {
    "input_tokens": 19,
    "output_tokens": 20,
    "total_tokens": 39
  }
}

Bind tools

import { z } from 'zod';

const GetWeather = {
  name: "GetWeather",
  description: "Get the current weather in a given location",
  schema: z.object({
    location: z.string().describe("The city and state, e.g. San Francisco, CA")
  }),
}

const GetPopulation = {
  name: "GetPopulation",
  description: "Get the current population in a given location",
  schema: z.object({
    location: z.string().describe("The city and state, e.g. San Francisco, CA")
  }),
}

const llmWithTools = llm.bindTools([GetWeather, GetPopulation]);
const aiMsg = await llmWithTools.invoke(
  "Which city is hotter today and which is bigger: LA or NY?"
);
console.log(aiMsg.tool_calls);

[
  {
    name: 'GetWeather',
    args: { location: 'Los Angeles, CA' },
    id: '49410cad-2163-415e-bdcd-d26938a9c8c5',
    type: 'tool_call'
  },
  {
    name: 'GetPopulation',
    args: { location: 'New York, NY' },
    id: '39e230e4-63ec-4fae-9df0-21c3abe735ad',
    type: 'tool_call'
  }
]

Structured Output

import { z } from 'zod';

const Joke = z.object({
  setup: z.string().describe("The setup of the joke"),
  punchline: z.string().describe("The punchline to the joke"),
  rating: z.number().optional().describe("How funny the joke is, from 1 to 10")
}).describe('Joke to tell user.');

const structuredLlm = llm.withStructuredOutput(Joke, { name: "Joke" });
const jokeResult = await structuredLlm.invoke("Tell me a joke about cats");
console.log(jokeResult);

{
  punchline: 'Why did the cat join a band? Because it wanted to be the purr-cussionist!',
  rating: 8,
  setup: 'A cat walks into a music store and asks the owner...'
}

Usage Metadata

const aiMsgForMetadata = await llm.invoke(input);
console.log(aiMsgForMetadata.usage_metadata);

{ input_tokens: 19, output_tokens: 20, total_tokens: 39 }

Response Metadata

const aiMsgForResponseMetadata = await llm.invoke(input);
console.log(aiMsgForResponseMetadata.response_metadata);

{
  model: 'llama3.1:8b',
  created_at: '2024-08-12T22:17:42.274795Z',
  done_reason: 'stop',
  done: true,
  total_duration: 6767071209,
  load_duration: 31628209,
  prompt_eval_count: 19,
  prompt_eval_duration: 6124504000,
  eval_count: 20,
  eval_duration: 608785000
}

Hierarchy (View Summary)

BaseDynamicToolInput<ChatOllamaCallOptions, BaseDynamicToolInput>
- ChatOllama

Implements

ChatOllamaInput

Constructors

constructor

new ChatOllama(fields?: ChatOllamaInput): ChatOllama
Parameters
- Optionalfields: ChatOllamaInput
Returns ChatOllama
Overrides BaseChatModel<ChatOllamaCallOptions, AIMessageChunk>.constructor
- Defined in remotes/langchain-ai/langchainjs/main/libs/providers/langchain-ollama/src/chat_models.ts:499

Properties

baseUrl

baseUrl: string = "http://127.0.0.1:11434"

The host URL of the Ollama server.

Default

"http://127.0.0.1:11434"

checkOrPullModel

checkOrPullModel: boolean = false

Whether or not to check the model exists on the local machine before invoking it. If set to true, the model will be pulled if it does not exist.

Default

false

client

client: Ollama

`Optional`embeddingOnly

embeddingOnly?: boolean

`Optional`f16Kv

f16Kv?: boolean

`Optional`format

format?: string | Record<string, any>

`Optional`frequencyPenalty

frequencyPenalty?: number

`Optional`keepAlive

keepAlive?: string | number

Default

"5m"

`Optional`logitsAll

logitsAll?: boolean

`Optional`lowVram

lowVram?: boolean

`Optional`mainGpu

mainGpu?: number

`Optional`mirostat

mirostat?: number

`Optional`mirostatEta

mirostatEta?: number

`Optional`mirostatTau

mirostatTau?: number

model

model: string = "llama3"

The model to invoke. If the model does not exist, it will be pulled.

Default

"llama3"

`Optional`numa

numa?: boolean

`Optional`numBatch

numBatch?: number

`Optional`numCtx

numCtx?: number

`Optional`numGpu

numGpu?: number

`Optional`numKeep

numKeep?: number

`Optional`numPredict

numPredict?: number

`Optional`numThread

numThread?: number

`Optional`penalizeNewline

penalizeNewline?: boolean

`Optional`presencePenalty

presencePenalty?: number

`Optional`repeatLastN

repeatLastN?: number

`Optional`repeatPenalty

repeatPenalty?: number

`Optional`seed

seed?: number

`Optional`streaming

streaming?: boolean

`Optional`temperature

temperature?: number

`Optional`tfsZ

tfsZ?: number

`Optional`think

think?: boolean

`Optional`topK

topK?: number

`Optional`topP

topP?: number

`Optional`typicalP

typicalP?: number

`Optional`useMlock

useMlock?: boolean

`Optional`useMmap

useMmap?: boolean

`Optional`vocabOnly

vocabOnly?: boolean

Methods

_generate

_generate(
    messages: BaseMessage[],
    options: unknown,
    runManager?: any,
): Promise<ChatResult>
Parameters
- messages: BaseMessage[]
- options: unknown
- OptionalrunManager: any
Returns Promise<ChatResult>
- Defined in remotes/langchain-ai/langchainjs/main/libs/providers/langchain-ollama/src/chat_models.ts:665

_llmType

_llmType(): string
Returns string
- Defined in remotes/langchain-ai/langchainjs/main/libs/providers/langchain-ollama/src/chat_models.ts:547

_streamResponseChunks

_streamResponseChunks(
    messages: BaseMessage[],
    options: unknown,
    runManager?: any,
): AsyncGenerator<ChatGenerationChunk>
Parameters
- messages: BaseMessage[]
- options: unknown
- OptionalrunManager: any
Returns AsyncGenerator<ChatGenerationChunk>
- Defined in remotes/langchain-ai/langchainjs/main/libs/providers/langchain-ollama/src/chat_models.ts:712

bindTools

bindTools(
tools: BindToolsInput[],
kwargs?: Partial<unknown>,
): Runnable<BaseLanguageModelInput, AIMessageChunk, ChatOllamaCallOptions>
Parameters
- tools: BindToolsInput[]
- Optionalkwargs: Partial<unknown>
Returns Runnable<BaseLanguageModelInput, AIMessageChunk, ChatOllamaCallOptions>
- Defined in remotes/langchain-ai/langchainjs/main/libs/providers/langchain-ollama/src/chat_models.ts:582

getLsParams

getLsParams(options: unknown): LangSmithParams
Parameters
- options: unknown
Returns LangSmithParams
- Defined in remotes/langchain-ai/langchainjs/main/libs/providers/langchain-ollama/src/chat_models.ts:592

invocationParams

invocationParams(options?: unknown): Omit<OllamaChatRequest, "messages">
Parameters
- Optionaloptions: unknown
Returns Omit<OllamaChatRequest, "messages">
- Defined in remotes/langchain-ai/langchainjs/main/libs/providers/langchain-ollama/src/chat_models.ts:604

pull

pull(model: string, options?: PullModelOptions): Promise<void>
Download a model onto the local machine.
Parameters
- model: string
  The name of the model to download.
- Optionaloptions: PullModelOptions
  Options for pulling the model.
Returns Promise<void>
- Defined in remotes/langchain-ai/langchainjs/main/libs/providers/langchain-ollama/src/chat_models.ts:558

withStructuredOutput

withStructuredOutput<
    RunOutput extends Record<string, any> = Record<string, any>,
>(
    outputSchema: any,
    config?: any,
): Runnable<BaseLanguageModelInput, RunOutput>
Type Parameters
- RunOutput extends Record<string, any> = Record<string, any>
Parameters
- outputSchema: any
- Optionalconfig: any
Returns Runnable<BaseLanguageModelInput, RunOutput>
- Defined in remotes/langchain-ai/langchainjs/main/libs/providers/langchain-ollama/src/chat_models.ts:777
withStructuredOutput<
    RunOutput extends Record<string, any> = Record<string, any>,
>(
    outputSchema: any,
    config?: any,
): Runnable<BaseLanguageModelInput, { parsed: RunOutput; raw: BaseMessage }>
Type Parameters
- RunOutput extends Record<string, any> = Record<string, any>
Parameters
- outputSchema: any
- Optionalconfig: any
Returns Runnable<BaseLanguageModelInput, { parsed: RunOutput; raw: BaseMessage }>
- Defined in remotes/langchain-ai/langchainjs/main/libs/providers/langchain-ollama/src/chat_models.ts:788
withStructuredOutput<
    RunOutput extends Record<string, any> = Record<string, any>,
>(
    outputSchema: any,
    config?: any,
): any
Type Parameters
- RunOutput extends Record<string, any> = Record<string, any>
Parameters
- outputSchema: any
- Optionalconfig: any
Returns any
- Defined in remotes/langchain-ai/langchainjs/main/libs/providers/langchain-ollama/src/chat_models.ts:799

`Static`lc_name

lc_name(): string
Returns string
- Defined in remotes/langchain-ai/langchainjs/main/libs/providers/langchain-ollama/src/chat_models.ts:420

Class ChatOllama

Constructor args

Runtime args

Examples

Hierarchy (View Summary)

Implements

Index

Constructors

Properties

Methods

Constructors

constructor

Parameters

Returns ChatOllama

Properties

baseUrl

Default

checkOrPullModel

Default

client

OptionalembeddingOnly

Optionalf16Kv

Optionalformat

OptionalfrequencyPenalty

OptionalkeepAlive

Default

OptionallogitsAll

OptionallowVram

OptionalmainGpu

Optionalmirostat

OptionalmirostatEta

OptionalmirostatTau

model

Default

Optionalnuma

OptionalnumBatch

OptionalnumCtx

OptionalnumGpu

OptionalnumKeep

OptionalnumPredict

OptionalnumThread

OptionalpenalizeNewline

OptionalpresencePenalty

OptionalrepeatLastN

OptionalrepeatPenalty

Optionalseed

Optionalstreaming

Optionaltemperature

OptionaltfsZ

Optionalthink

OptionaltopK

OptionaltopP

OptionaltypicalP

OptionaluseMlock

OptionaluseMmap

OptionalvocabOnly

Methods

_generate

Parameters

Returns Promise<ChatResult>

_llmType

Returns string

_streamResponseChunks

Parameters

Returns AsyncGenerator<ChatGenerationChunk>

bindTools

Parameters

Returns Runnable<BaseLanguageModelInput, AIMessageChunk, ChatOllamaCallOptions>

getLsParams

Parameters

Returns LangSmithParams

invocationParams

Parameters

Returns Omit<OllamaChatRequest, "messages">

pull

Parameters

Returns Promise<void>

withStructuredOutput

Type Parameters

Parameters

`Optional`embeddingOnly

`Optional`f16Kv

`Optional`format

`Optional`frequencyPenalty

`Optional`keepAlive

`Optional`logitsAll

`Optional`lowVram

`Optional`mainGpu

`Optional`mirostat

`Optional`mirostatEta

`Optional`mirostatTau

`Optional`numa

`Optional`numBatch

`Optional`numCtx

`Optional`numGpu

`Optional`numKeep

`Optional`numPredict

`Optional`numThread

`Optional`penalizeNewline

`Optional`presencePenalty

`Optional`repeatLastN

`Optional`repeatPenalty

`Optional`seed

`Optional`streaming

`Optional`temperature

`Optional`tfsZ

`Optional`think

`Optional`topK

`Optional`topP

`Optional`typicalP

`Optional`useMlock

`Optional`useMmap

`Optional`vocabOnly

`Static`lc_name