vllm.model_executor.layers.pooler.seqwise.poolers ¶

SequencePoolerOutput `module-attribute` ¶

SequencePoolerOutput: TypeAlias = Tensor | list[Tensor]

SequencePoolingFn `module-attribute` ¶

SequencePoolingFn: TypeAlias = Callable[
    [Tensor, PoolingMetadata], SequencePoolingMethodOutput
]

SequencePoolingHeadFn `module-attribute` ¶

SequencePoolingHeadFn: TypeAlias = Callable[
    [SequencePoolingMethodOutput, PoolingMetadata],
    SequencePoolerHeadOutput,
]

SequencePooler ¶

Bases: Pooler

A layer that pools specific information from hidden states.

This layer does the following: 1. Extracts specific tokens or aggregates data based on pooling method. 2. Postprocesses the output based on pooling head. 3. Returns structured results as PoolerOutput.

Source code in vllm/model_executor/layers/pooler/seqwise/poolers.py

class SequencePooler(Pooler):
    """
    A layer that pools specific information from hidden states.

    This layer does the following:
    1. Extracts specific tokens or aggregates data based on pooling method.
    2. Postprocesses the output based on pooling head.
    3. Returns structured results as `PoolerOutput`.
    """

    def __init__(
        self,
        pooling: SequencePoolingMethod | SequencePoolingFn,
        head: SequencePoolerHead | SequencePoolingHeadFn,
    ) -> None:
        super().__init__()

        self.pooling = pooling
        self.head = head

    def get_supported_tasks(self) -> Set[PoolingTask]:
        tasks = set(POOLING_TASKS)

        if isinstance(self.pooling, SequencePoolingMethod):
            tasks &= self.pooling.get_supported_tasks()
        if isinstance(self.head, SequencePoolerHead):
            tasks &= self.head.get_supported_tasks()

        return tasks

    def get_pooling_updates(self, task: PoolingTask) -> PoolingParamsUpdate:
        updates = PoolingParamsUpdate()

        if isinstance(self.pooling, SequencePoolingMethod):
            updates |= self.pooling.get_pooling_updates(task)

        return updates

    def forward(
        self,
        hidden_states: torch.Tensor,
        pooling_metadata: PoolingMetadata,
    ) -> SequencePoolerOutput:
        pooled_data = self.pooling(hidden_states, pooling_metadata)
        pooled_data = self.head(pooled_data, pooling_metadata)
        return pooled_data

head `instance-attribute` ¶

head = head

pooling `instance-attribute` ¶

pooling = pooling

init ¶

__init__(
    pooling: SequencePoolingMethod | SequencePoolingFn,
    head: SequencePoolerHead | SequencePoolingHeadFn,
) -> None

Source code in vllm/model_executor/layers/pooler/seqwise/poolers.py

def __init__(
    self,
    pooling: SequencePoolingMethod | SequencePoolingFn,
    head: SequencePoolerHead | SequencePoolingHeadFn,
) -> None:
    super().__init__()

    self.pooling = pooling
    self.head = head

forward ¶

forward(
    hidden_states: Tensor, pooling_metadata: PoolingMetadata
) -> SequencePoolerOutput

Source code in vllm/model_executor/layers/pooler/seqwise/poolers.py

def forward(
    self,
    hidden_states: torch.Tensor,
    pooling_metadata: PoolingMetadata,
) -> SequencePoolerOutput:
    pooled_data = self.pooling(hidden_states, pooling_metadata)
    pooled_data = self.head(pooled_data, pooling_metadata)
    return pooled_data

get_pooling_updates ¶

get_pooling_updates(
    task: PoolingTask,
) -> PoolingParamsUpdate

Source code in vllm/model_executor/layers/pooler/seqwise/poolers.py

def get_pooling_updates(self, task: PoolingTask) -> PoolingParamsUpdate:
    updates = PoolingParamsUpdate()

    if isinstance(self.pooling, SequencePoolingMethod):
        updates |= self.pooling.get_pooling_updates(task)

    return updates

get_supported_tasks ¶

get_supported_tasks() -> Set[PoolingTask]

Source code in vllm/model_executor/layers/pooler/seqwise/poolers.py

def get_supported_tasks(self) -> Set[PoolingTask]:
    tasks = set(POOLING_TASKS)

    if isinstance(self.pooling, SequencePoolingMethod):
        tasks &= self.pooling.get_supported_tasks()
    if isinstance(self.head, SequencePoolerHead):
        tasks &= self.head.get_supported_tasks()

    return tasks

pooler_for_classify ¶

pooler_for_classify(
    pooler_config: PoolerConfig,
    *,
    pooling: SequencePoolingMethod
    | SequencePoolingFn
    | None = None,
    classifier: ClassifierFn | None = None,
    act_fn: PoolerActivation | str | None = None,
)

Source code in vllm/model_executor/layers/pooler/seqwise/poolers.py

def pooler_for_classify(
    pooler_config: PoolerConfig,
    *,
    pooling: SequencePoolingMethod | SequencePoolingFn | None = None,
    classifier: ClassifierFn | None = None,
    act_fn: PoolerActivation | str | None = None,
):
    if pooling is None:
        pooling = get_seq_pooling_method(pooler_config.get_seq_pooling_type())

    vllm_config = get_current_vllm_config()
    model_config = vllm_config.model_config
    head = ClassifierPoolerHead(
        head_dtype=model_config.head_dtype,
        classifier=classifier,
        logit_bias=model_config.pooler_config.logit_bias,
        activation=resolve_classifier_act_fn(
            model_config, static_num_labels=True, act_fn=act_fn
        ),
    )

    return SequencePooler(pooling=pooling, head=head)

pooler_for_embed ¶

pooler_for_embed(pooler_config: PoolerConfig)

Source code in vllm/model_executor/layers/pooler/seqwise/poolers.py

def pooler_for_embed(pooler_config: PoolerConfig):
    pooling = get_seq_pooling_method(pooler_config.get_seq_pooling_type())

    vllm_config = get_current_vllm_config()
    model_config = vllm_config.model_config
    head = EmbeddingPoolerHead(
        head_dtype=model_config.head_dtype,
        projector=_load_st_projector(model_config),
        activation=PoolerNormalize(),
    )

    return SequencePooler(pooling=pooling, head=head)

vllm.model_executor.layers.pooler.seqwise.poolers ¶

SequencePoolerOutput module-attribute ¶

SequencePoolingFn module-attribute ¶

SequencePoolingHeadFn module-attribute ¶

SequencePooler ¶

head instance-attribute ¶

pooling instance-attribute ¶

__init__ ¶

forward ¶

get_pooling_updates ¶

get_supported_tasks ¶

pooler_for_classify ¶

pooler_for_embed ¶

SequencePoolerOutput `module-attribute` ¶

SequencePoolingFn `module-attribute` ¶

SequencePoolingHeadFn `module-attribute` ¶

head `instance-attribute` ¶

pooling `instance-attribute` ¶

init ¶