GitHub - paulzmq/SEK: The replication package of paper "SEK: Self-Explained Keywords Empower Large Language Models for Code Generation"

Self-Explained Keywords Empower Large Language Models for Code Generation

We are happy to introduce SEK, which is a simple yet effective method that enhances LLMs' code generation by guiding them to extract, explain, and rank key terms from problem statements. SEK works as follows:

The corpus for computing document frequency can be found here.

To evaluate SEK on Humaneval(+), MBPP(+), APPS

First install the envirement

pip install -r requirements.txt

Then run the following commend:

python generate.py \
    --model_type "llama-3.1" \
    --model_size "70b-ins" \
    --greedy \
    --root outputs \
    --dataset [humaneval|mbpp|apps-introductory|apps-interview|apps-competition] \
    --backend vllm \
    --with_keywords true

When you get the output, run:

evalplus.sanitize --samples SAVE_PATH
evalplus.evaluate \
  --dataset $TASK \
  --samples SANITIZE_SAVE_PATH

To evaulate SEK on BigCodeBench

First go into the bigcodebench dir.

cd bigcodebench

Then run the following commend:

bigcodebench.evaluate \
    --model "Llama-3.1-70B-Instruct" \
    --split  "complete"\
    --subset "hard" \
    --backend vllm \
    --greedy \
    --bs 1 \

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
apps_metric		apps_metric
assert		assert
bigcodebench		bigcodebench
__init__.py		__init__.py
apps.sh		apps.sh
filter_keyword.py		filter_keyword.py
generate.py		generate.py
mbpp.sh		mbpp.sh
modele.py		modele.py
prompt.py		prompt.py
readme.md		readme.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Self-Explained Keywords Empower Large Language Models for Code Generation

To evaluate SEK on Humaneval(+), MBPP(+), APPS

To evaulate SEK on BigCodeBench

About

Uh oh!

Releases

Packages

Languages

paulzmq/SEK

Folders and files

Latest commit

History

Repository files navigation

Self-Explained Keywords Empower Large Language Models for Code Generation

To evaluate SEK on Humaneval(+), MBPP(+), APPS

To evaulate SEK on BigCodeBench

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages