Skip to content

SentenceSplitter

Defined in: packages/core/src/node-parser/sentence-splitter.ts:23

Parse text with a preference for complete sentences.

Extends

MetadataAwareTextSplitter

SentenceSplitter<Options>(nodes, options?): TextNode<Metadata>[]

Defined in: packages/core/src/node-parser/sentence-splitter.ts:23

Parse text with a preference for complete sentences.

Type Parameters

Options

Options extends Record<string, unknown>

Parameters

nodes

BaseNode<Metadata>[]

options?

Options

Returns

TextNode<Metadata>[]

Constructors

Constructor

new SentenceSplitter(params?): SentenceSplitter

Defined in: packages/core/src/node-parser/sentence-splitter.ts:56

Parameters

params?

Partial<SentenceSplitterParams> & SplitterParams & object

Returns

SentenceSplitter

Overrides

MetadataAwareTextSplitter.constructor

Properties

includeMetadata

includeMetadata: boolean = true

Defined in: packages/core/src/node-parser/base.ts:17

Inherited from

MetadataAwareTextSplitter.includeMetadata

includePrevNextRel

includePrevNextRel: boolean = true

Defined in: packages/core/src/node-parser/base.ts:18

Inherited from

MetadataAwareTextSplitter.includePrevNextRel

chunkSize

chunkSize: number = 1024

Defined in: packages/core/src/node-parser/sentence-splitter.ts:27

The chunk size for each chunk. If no tokenSizer is set, this is the number of characters in the chunk. If a tokenSizer is set, this is the number of tokens in the chunk.

chunkOverlap

chunkOverlap: number = 200

Defined in: packages/core/src/node-parser/sentence-splitter.ts:31

The chunk overlap of each chunk when splitting. If no tokenSizer is set, this is the number of characters in the overlap. If a tokenSizer is set, this is the number of tokens in the overlap.

separator

separator: string = " "

Defined in: packages/core/src/node-parser/sentence-splitter.ts:35

Default separator for splitting into words

paragraphSeparator

paragraphSeparator: string = "\n\n\n"

Defined in: packages/core/src/node-parser/sentence-splitter.ts:39

Separator between paragraphs.

secondaryChunkingRegex

secondaryChunkingRegex: string = "[^,.;。？！]+[,.;。？！]?"

Defined in: packages/core/src/node-parser/sentence-splitter.ts:43

Backup regex for splitting into sentences.

extraAbbreviations

extraAbbreviations: string[] | undefined = []

Defined in: packages/core/src/node-parser/sentence-splitter.ts:48

Extra abbreviations to consider while splitting into sentences. For example, for contracts, you may want to consider “LLC.” as an important abbreviation

id

id: string

Defined in: packages/core/src/schema/type.ts:22

Inherited from

MetadataAwareTextSplitter.id

Methods

postProcessParsedNodes()

protected postProcessParsedNodes(nodes, parentDocMap): TextNode<Metadata>[]

Defined in: packages/core/src/node-parser/base.ts:27

Parameters

nodes

TextNode<Metadata>[]

parentDocMap

Map<string, TextNode<Metadata>>

Returns

TextNode<Metadata>[]

Inherited from

MetadataAwareTextSplitter.postProcessParsedNodes

getNodesFromDocuments()

getNodesFromDocuments(documents): TextNode<Metadata>[]

Defined in: packages/core/src/node-parser/base.ts:84

Parameters

documents

TextNode<Metadata>[]

Returns

TextNode<Metadata>[]

Inherited from

MetadataAwareTextSplitter.getNodesFromDocuments

splitTexts()

splitTexts(texts): string[]

Defined in: packages/core/src/node-parser/base.ts:126

Parameters

texts

string[]

Returns

string[]

Inherited from

MetadataAwareTextSplitter.splitTexts

splitTextsMetadataAware()

splitTextsMetadataAware(texts, metadata): string[]

Defined in: packages/core/src/node-parser/base.ts:142

Parameters

texts

string[]

metadata

string[]

Returns

string[]

Inherited from

MetadataAwareTextSplitter.splitTextsMetadataAware

getMetadataString()

protected getMetadataString(node): string

Defined in: packages/core/src/node-parser/base.ts:151

Parameters

node

Returns

string

Inherited from

MetadataAwareTextSplitter.getMetadataString

parseNodes()

protected parseNodes(nodes): TextNode<Metadata>[]

Defined in: packages/core/src/node-parser/base.ts:161

Parameters

nodes

TextNode<Metadata>[]

Returns

TextNode<Metadata>[]

Inherited from

MetadataAwareTextSplitter.parseNodes

splitTextMetadataAware()

splitTextMetadataAware(text, metadata): string[]

Defined in: packages/core/src/node-parser/sentence-splitter.ts:82

Parameters

text

string

metadata

string

Returns

string[]

Overrides

MetadataAwareTextSplitter.splitTextMetadataAware

splitText()

splitText(text): string[]

Defined in: packages/core/src/node-parser/sentence-splitter.ts:97

Parameters

text

string

Returns

string[]

Overrides

MetadataAwareTextSplitter.splitText

_splitText()

_splitText(text, chunkSize): string[]

Defined in: packages/core/src/node-parser/sentence-splitter.ts:101

Parameters

text

string

chunkSize

number

Returns

string[]