test-ragp / src /rag_pipelines /prompts /retrieval_evalution.py

Upload 107 files

336f4a9 verified 9 months ago

4.33 kB

	from typing import Literal

	from pydantic import BaseModel, Field, field_validator

	RETRIEVAL_EVALUATION_PROMPT = """You are a senior analyst evaluating document relevance. Follow these steps:

	1. Question Core: Identify essential information needed
	2. Document Facts: Extract concrete claims from text
	3. Direct Overlap: Verify question-document concept matches
	4. Indirect Support: Evaluate contextual relevance
	5. Final Synthesis: Combine analysis into verdict

	Question: {question}

	Document Excerpt: {context}

	Provide detailed reasoning through all steps, then state final decision as 'relevant' or 'irrelevant'."""


	class RetrievalEvaluationResult(BaseModel):
	"""Pydantic model for validating structured relevance evaluation results.

	Enforces complete reasoning chain and constrained decision output through
	validation rules. Designed for integration with LLM structured output pipelines.

	Attributes:
	reasoning_chain (str): Sequential analysis following required evaluation steps.
	Must contain all required section headers.
	decision (Literal["relevant", "irrelevant"]): Final relevance determination.

	Raises:
	ValidationError: If reasoning chain misses required sections or length constraints

	Examples:
	>>> valid_instance = RetrievalEvaluator(
	... reasoning_chain=(
	... "1. Question Core: Cloud security practices"
	... "2. Document Facts: AWS IAM details"
	... "3. Direct Overlap: Security focus match"
	... "4. Indirect Support: Implementation examples"
	... "5. Final Synthesis: Directly addresses question"
	... ),
	... decision="relevant"
	... )
	>>> isinstance(valid_instance, RetrievalEvaluator)
	True
	"""

	reasoning_chain: str = Field(
	default=...,
	description="Sequential analysis through required evaluation stages. Must contain: 1. Question Core, "
	"2. Document Facts, 3. Direct Overlap, 4. Indirect Support, 5. Final Synthesis sections.",
	)
	decision: Literal["relevant", "irrelevant"] = Field(
	default=...,
	description="Binary relevance determination based on structured analysis of document content against query "
	"requirements.",
	)

	@field_validator("reasoning_chain")
	@classmethod
	def validate_reasoning_steps(cls, chain_to_validate: str) -> str:
	r"""Validate reasoning chain contains all required analysis sections.

	Args:
	chain_to_validate (str): Input reasoning chain text to validate

	Returns:
	str: Validated reasoning chain text if all sections present

	Raises:
	ValueError: If any required section headers are missing from the text

	Example:
	>>> valid_chain = (
	... "1. Question Core: ... 2. Document Facts: ... 3. Direct Overlap: ...4. Indirect Support: ..."
	... "5. Final Synthesis: ..."
	... )
	>>> RetrievalEvaluator.validate_reasoning_steps(valid_chain)
	'1. Question Core: ... 2. Document Facts: ... 3. Direct Overlap: ... 4. Indirect Support: ...
	5. Final Synthesis: ...'
	"""
	required_steps = [
	"1. Question Core",
	"2. Document Facts",
	"3. Direct Overlap",
	"4. Indirect Support",
	"5. Final Synthesis",
	]

	missing: list[str] = [step for step in required_steps if step not in chain_to_validate]
	if missing:
	msg = f"Missing required analysis steps: {missing}"
	raise ValueError(msg)
	return chain_to_validate

	model_config = {
	"json_schema_extra": {
	"example": {
	"reasoning_chain": (
	"1. Question Core: Requires cloud security best practices\n"
	"2. Document Facts: Details AWS IAM role configurations\n"
	"3. Direct Overlap: Matches cloud security focus\n"
	"4. Indirect Support: Provides implementation examples\n"
	"5. Final Synthesis: Directly addresses core security question"
	),
	"decision": "relevant",
	}
	}
	}