Index

Symbols | _ | A | B | C | D | E | F | G | H | I | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y

Symbols

**kwargs (rl4co.models.rl.reinforce.reinforce.REINFORCE parameter), [1]

**unused_kw (rl4co.models.zoo.common.autoregressive.policy.AutoregressivePolicy parameter)

_

__call__() (rl4co.data.transforms.StateAugmentation method)
- (rl4co.tasks.eval.EvalBase method)

A

B

C

D

E

F

G

H

I

K

key_padding_mask (rl4co.models.nn.flash_attention.CrossAttention.forward parameter)
- (rl4co.models.nn.flash_attention.MHA.forward parameter)
- (rl4co.models.nn.flash_attention.SelfAttention.forward parameter)

kv (rl4co.models.nn.flash_attention.CrossAttention.forward parameter)
- (rl4co.models.nn.flash_attention.FlashCrossAttention.forward parameter)

L

M

N

O

P

Q

q (rl4co.models.nn.flash_attention.CrossAttention.forward parameter)

R

random_policy() (in module rl4co.models.nn.utils)
RandomPolicy (class in rl4co.models.nn.utils)
recurrence() (rl4co.models.zoo.ptrnet.decoder.Decoder method)
ref (rl4co.models.zoo.ptrnet.decoder.SimpleAttention.forward parameter)
REINFORCE (class in rl4co.models.rl.reinforce.reinforce), [1]
REINFORCEBaseline (class in rl4co.models.rl.reinforce.baselines), [1]
render() (rl4co.envs.atsp.ATSPEnv static method)
- (rl4co.envs.common.base.RL4COEnvBase method), [1]
- (rl4co.envs.cvrp.CVRPEnv static method)
- (rl4co.envs.dpp.DPPEnv method)
- (rl4co.envs.ffsp.FFSPEnv method)
- (rl4co.envs.mdpp.MDPPEnv method)
- (rl4co.envs.mtsp.MTSPEnv static method)
- (rl4co.envs.op.OPEnv static method)
- (rl4co.envs.pctsp.PCTSPEnv static method)
- (rl4co.envs.pdp.PDPEnv static method)
- (rl4co.envs.tsp.TSPEnv static method)
residual (rl4co.models.nn.graph.gcn.GCNEncoder parameter)
return_actions (rl4co.models.zoo.common.autoregressive.policy.AutoregressivePolicy.forward parameter)
- (rl4co.models.zoo.mdam.policy.MDAMPolicy.forward parameter)
- (rl4co.models.zoo.symnco.policy.SymNCOPolicy.forward parameter)
return_entropy (rl4co.models.zoo.common.autoregressive.policy.AutoregressivePolicy.forward parameter)
- (rl4co.models.zoo.mdam.policy.MDAMPolicy.forward parameter)
- (rl4co.models.zoo.symnco.policy.SymNCOPolicy.forward parameter)
reward (rl4co.models.rl.reinforce.reinforce.REINFORCE.calculate_loss parameter), [1]
reward_type (rl4co.envs.mdpp.MDPPEnv parameter)
rl4co.data.dataset
- module
rl4co.data.generate_data
- module
rl4co.data.transforms
- module
rl4co.data.utils
- module
rl4co.envs.atsp
- module
rl4co.envs.common.base
- module, [1]
rl4co.envs.cvrp
- module
rl4co.envs.dpp
- module
rl4co.envs.ffsp
- module
rl4co.envs.mdpp
- module
rl4co.envs.mtsp
- module
rl4co.envs.op
- module
rl4co.envs.pctsp
- module
rl4co.envs.pdp
- module
rl4co.envs.sdvrp
- module
rl4co.envs.spctsp
- module
rl4co.envs.tsp
- module
rl4co.models.nn.attention
- module
rl4co.models.nn.env_embeddings.context
- module
rl4co.models.nn.env_embeddings.dynamic
- module
rl4co.models.nn.env_embeddings.init
- module
rl4co.models.nn.flash_attention
- module
rl4co.models.nn.graph.attnnet
- module
rl4co.models.nn.graph.gcn
- module
rl4co.models.nn.graph.mpnn
- module
rl4co.models.nn.mlp
- module
rl4co.models.nn.ops
- module

rl4co.models.nn.utils
- module
rl4co.models.rl.common.base
- module
rl4co.models.rl.common.critic
- module
rl4co.models.rl.ppo.ppo
- module, [1]
rl4co.models.rl.reinforce.baselines
- module, [1]
rl4co.models.rl.reinforce.reinforce
- module, [1]
rl4co.models.zoo.active_search.search
- module
rl4co.models.zoo.am.model
- module
rl4co.models.zoo.am.policy
- module
rl4co.models.zoo.common.autoregressive.decoder
- module
rl4co.models.zoo.common.autoregressive.encoder
- module
rl4co.models.zoo.common.autoregressive.policy
- module
rl4co.models.zoo.eas.decoder
- module
rl4co.models.zoo.eas.nn
- module
rl4co.models.zoo.eas.search
- module
rl4co.models.zoo.ham.attention
- module
rl4co.models.zoo.ham.encoder
- module
rl4co.models.zoo.ham.model
- module
rl4co.models.zoo.ham.policy
- module
rl4co.models.zoo.mdam.decoder
- module
rl4co.models.zoo.mdam.encoder
- module
rl4co.models.zoo.mdam.model
- module
rl4co.models.zoo.mdam.policy
- module
rl4co.models.zoo.pomo.model
- module
rl4co.models.zoo.pomo.policy
- module
rl4co.models.zoo.ppo.decoder
- module
rl4co.models.zoo.ppo.model
- module
rl4co.models.zoo.ppo.policy
- module
rl4co.models.zoo.ptrnet.critic
- module
rl4co.models.zoo.ptrnet.decoder
- module
rl4co.models.zoo.ptrnet.encoder
- module
rl4co.models.zoo.ptrnet.model
- module
rl4co.models.zoo.ptrnet.policy
- module
rl4co.models.zoo.symnco.losses
- module
rl4co.models.zoo.symnco.model
- module
rl4co.models.zoo.symnco.policy
- module
rl4co.tasks.eval
- module
rl4co.tasks.train
- module
RL4COEnvBase (class in rl4co.envs.common.base), [1]
RL4COLitModule (class in rl4co.models.rl.common.base)
rollout() (in module rl4co.models.nn.utils)
- (rl4co.models.rl.reinforce.baselines.RolloutBaseline method), [1]
RolloutBaseline (class in rl4co.models.rl.reinforce.baselines), [1]